Datamining - teorie a praxe
Název práce: | Datamining - theory and it's application |
---|---|
Autor(ka) práce: | Popelka, Aleš |
Typ práce: | Diploma thesis |
Vedoucí práce: | Maryška, Miloš |
Oponenti práce: | Machač, Ivo |
Jazyk práce: | English |
Abstrakt: | This thesis deals with the topic of the technology called data mining. First, the thesis describes the term data mining as an independent discipline and then its processing methods and the most common use. The term data mining is thereafter explained with the help of methodologies describing all parts of the process of knowledge discovery in databases -- CRISP-DM, SEMMA. The study's purpose is presenting new data mining methods and particular algorithms -- decision trees, neural networks and genetic algorithms. These facts are used as theoretical introduction, which is followed by practical application searching for causes of meningoencephalitis development of certain sample of patients. Decision trees in system Clementine, which is one of the top datamining tools, were used for the analysys. |
Klíčová slova: | decision trees; genetic algorithms; neuronal networks; SEMMA; CRISP-DM; data mining |
Název práce: | Datamining - teorie a praxe |
---|---|
Autor(ka) práce: | Popelka, Aleš |
Typ práce: | Diplomová práce |
Vedoucí práce: | Maryška, Miloš |
Oponenti práce: | Machač, Ivo |
Jazyk práce: | English |
Abstrakt: | Tato diplomová práce zpracovává téma technologie zvané data mining. Práce nejdříve popisuje data mining jako svébytný obor a dále jeho procesní postupy a nejčastější využití. Samotný pojem data mining je poté vysvětlen pomocí metodik popisujících jednotlivé části procesu dobývání znalostí z databází - CRISP-DM, SEMMA. Práce si dává za cíl představit hlavní metody data miningu a konkrétní algoritmy - rozhodovací stromy, neuronové sítě a genetické algoritmy, přičemž tato fakta jsou zároveň použita jako určitý teoretický úvod, na který navazuje praktická aplikace. V této aplikaci jde o hledání příčin vzniku meningoencefalitidy u určitého vzorku pacientů. Pro analýzu byly použity rozhodovací stromy v systému Clementine, který patří ke špičce dataminingových nástrojů. |
Klíčová slova: | CRISP-DM; data mining; SEMMA; genetické; rozhodovací stromy; neuronální sítě |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 31. 1. 2012 |
---|---|
Datum podání práce: | 30. 6. 2012 |
Datum obhajoby: | 29. 8. 2013 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/36521/podrobnosti |