Datamining - theory and it's application
Thesis title: | Datamining - theory and it's application |
---|---|
Author: | Popelka, Aleš |
Thesis type: | Diploma thesis |
Supervisor: | Maryška, Miloš |
Opponents: | Machač, Ivo |
Thesis language: | English |
Abstract: | This thesis deals with the topic of the technology called data mining. First, the thesis describes the term data mining as an independent discipline and then its processing methods and the most common use. The term data mining is thereafter explained with the help of methodologies describing all parts of the process of knowledge discovery in databases -- CRISP-DM, SEMMA. The study's purpose is presenting new data mining methods and particular algorithms -- decision trees, neural networks and genetic algorithms. These facts are used as theoretical introduction, which is followed by practical application searching for causes of meningoencephalitis development of certain sample of patients. Decision trees in system Clementine, which is one of the top datamining tools, were used for the analysys. |
Keywords: | decision trees; genetic algorithms; neuronal networks; SEMMA; CRISP-DM; data mining |
Thesis title: | Datamining - teorie a praxe |
---|---|
Author: | Popelka, Aleš |
Thesis type: | Diplomová práce |
Supervisor: | Maryška, Miloš |
Opponents: | Machač, Ivo |
Thesis language: | English |
Abstract: | Tato diplomová práce zpracovává téma technologie zvané data mining. Práce nejdříve popisuje data mining jako svébytný obor a dále jeho procesní postupy a nejčastější využití. Samotný pojem data mining je poté vysvětlen pomocí metodik popisujících jednotlivé části procesu dobývání znalostí z databází - CRISP-DM, SEMMA. Práce si dává za cíl představit hlavní metody data miningu a konkrétní algoritmy - rozhodovací stromy, neuronové sítě a genetické algoritmy, přičemž tato fakta jsou zároveň použita jako určitý teoretický úvod, na který navazuje praktická aplikace. V této aplikaci jde o hledání příčin vzniku meningoencefalitidy u určitého vzorku pacientů. Pro analýzu byly použity rozhodovací stromy v systému Clementine, který patří ke špičce dataminingových nástrojů. |
Keywords: | CRISP-DM; data mining; SEMMA; genetické; rozhodovací stromy; neuronální sítě |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 31. 1. 2012 |
---|---|
Date of submission: | 30. 6. 2012 |
Date of defense: | 29. 8. 2013 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/36521/podrobnosti |