Datamining - teorie a praxe

Název práce: Datamining - theory and it's application
Autor(ka) práce: Popelka, Aleš
Typ práce: Diploma thesis
Vedoucí práce: Maryška, Miloš
Oponenti práce: Machač, Ivo
Jazyk práce: English
Abstrakt:
This thesis deals with the topic of the technology called data mining. First, the thesis describes the term data mining as an independent discipline and then its processing methods and the most common use. The term data mining is thereafter explained with the help of methodologies describing all parts of the process of knowledge discovery in databases -- CRISP-DM, SEMMA. The study's purpose is presenting new data mining methods and particular algorithms -- decision trees, neural networks and genetic algorithms. These facts are used as theoretical introduction, which is followed by practical application searching for causes of meningoencephalitis development of certain sample of patients. Decision trees in system Clementine, which is one of the top datamining tools, were used for the analysys.
Klíčová slova: decision trees; genetic algorithms; neuronal networks; SEMMA; CRISP-DM; data mining
Název práce: Datamining - teorie a praxe
Autor(ka) práce: Popelka, Aleš
Typ práce: Diplomová práce
Vedoucí práce: Maryška, Miloš
Oponenti práce: Machač, Ivo
Jazyk práce: English
Abstrakt:
Tato diplomová práce zpracovává téma technologie zvané data mining. Práce nejdříve popisuje data mining jako svébytný obor a dále jeho procesní postupy a nejčastější využití. Samotný pojem data mining je poté vysvětlen pomocí metodik popisujících jednotlivé části procesu dobývání znalostí z databází - CRISP-DM, SEMMA. Práce si dává za cíl představit hlavní metody data miningu a konkrétní algoritmy - rozhodovací stromy, neuronové sítě a genetické algoritmy, přičemž tato fakta jsou zároveň použita jako určitý teoretický úvod, na který navazuje praktická aplikace. V této aplikaci jde o hledání příčin vzniku meningoencefalitidy u určitého vzorku pacientů. Pro analýzu byly použity rozhodovací stromy v systému Clementine, který patří ke špičce dataminingových nástrojů.
Klíčová slova: CRISP-DM; data mining; SEMMA; genetické; rozhodovací stromy; neuronální sítě

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 31. 1. 2012
Datum podání práce: 30. 6. 2012
Datum obhajoby: 29. 8. 2013
Identifikátor v systému InSIS: https://insis.vse.cz/zp/36521/podrobnosti

Soubory ke stažení

    Poslední aktualizace: