Datamining - theory and it's application

Thesis title: Datamining - theory and it's application
Author: Popelka, Aleš
Thesis type: Diploma thesis
Supervisor: Maryška, Miloš
Opponents: Machač, Ivo
Thesis language: English
Abstract:
This thesis deals with the topic of the technology called data mining. First, the thesis describes the term data mining as an independent discipline and then its processing methods and the most common use. The term data mining is thereafter explained with the help of methodologies describing all parts of the process of knowledge discovery in databases -- CRISP-DM, SEMMA. The study's purpose is presenting new data mining methods and particular algorithms -- decision trees, neural networks and genetic algorithms. These facts are used as theoretical introduction, which is followed by practical application searching for causes of meningoencephalitis development of certain sample of patients. Decision trees in system Clementine, which is one of the top datamining tools, were used for the analysys.
Keywords: decision trees; genetic algorithms; neuronal networks; SEMMA; CRISP-DM; data mining
Thesis title: Datamining - teorie a praxe
Author: Popelka, Aleš
Thesis type: Diplomová práce
Supervisor: Maryška, Miloš
Opponents: Machač, Ivo
Thesis language: English
Abstract:
Tato diplomová práce zpracovává téma technologie zvané data mining. Práce nejdříve popisuje data mining jako svébytný obor a dále jeho procesní postupy a nejčastější využití. Samotný pojem data mining je poté vysvětlen pomocí metodik popisujících jednotlivé části procesu dobývání znalostí z databází - CRISP-DM, SEMMA. Práce si dává za cíl představit hlavní metody data miningu a konkrétní algoritmy - rozhodovací stromy, neuronové sítě a genetické algoritmy, přičemž tato fakta jsou zároveň použita jako určitý teoretický úvod, na který navazuje praktická aplikace. V této aplikaci jde o hledání příčin vzniku meningoencefalitidy u určitého vzorku pacientů. Pro analýzu byly použity rozhodovací stromy v systému Clementine, který patří ke špičce dataminingových nástrojů.
Keywords: CRISP-DM; data mining; SEMMA; genetické; rozhodovací stromy; neuronální sítě

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 31. 1. 2012
Date of submission: 30. 6. 2012
Date of defense: 29. 8. 2013
Identifier in the InSIS system: https://insis.vse.cz/zp/36521/podrobnosti

Files for download

    Last update: