The real task of data mining
Thesis title: | Reálná úloha dobývání znalostí |
---|---|
Author: | Trondin, Anton |
Thesis type: | Diplomová práce |
Supervisor: | Berka, Petr |
Opponents: | Chudán, David |
Thesis language: | Česky |
Abstract: | Diplomová práce nese název "Reálná úloha dobývání znalostí", bude rozdělena na dvě velké části, a to na teoretickou a praktickou. V praktické části jsou popsané základní pojmy data mining, jednotlivé metody a typy úloh používaných pří dobývání znalosti z databáze a algoritmy relevantní pro tuto oblast problematiky. Velká kapitola je věnovaná metodice CRISP-DM a jednotlivým fázím dobývání znalostí z databáze, která bude použitá jako hlavní metodika při realizace praktické části diplomové práce, přičemž nebude zapomenuto i na ostatní méně známé a používané metodiky z dané oblasti. Na závěr teoretické části je prezentován seznam, jak placeného, tak volně dostupného softwaru, který lze použit pro dobývání znalostí z databáze. Druhá velká část diplomové práce se bude věnovat praktickému použití metodiky CRISP-DM podle jednotlivých kroků, které obsahuje nad reálnými daty z oblasti mobilní telekomunikace. Hlavní data mining úloha, která se řeší v praktické části, je predikce odhadu zákazníků mobilního operátora. Software pro dobývání znalostí z databáze byl zvolen mně známy IBM SPSS Modeler. Klíčová slova: data mining, dobývání znalostí z databáze, churn management, predikce, CRISP-DM |
Keywords: | predikce; churn management; dobývání znalostí z databáze; data mining; CRISP-DM |
Thesis title: | The real task of data mining |
---|---|
Author: | Trondin, Anton |
Thesis type: | Diploma thesis |
Supervisor: | Berka, Petr |
Opponents: | Chudán, David |
Thesis language: | Česky |
Abstract: | Diploma thesis " The real role of knowledge mining " is divided into two major parts, the theoretical and the practical. The practical part describes the basic concepts of data mining, various methods and types of tasks used for knowledge discovery in databases and algorithms used in this area . Main focus is devoted to the CRISP -DM methodology and to various stages of knowledge discovery from databases. This methodology will be later used as the basis for practical part of the thesis while other less known methods used for data mining won`t be neglected. List of paid and free software which can be used for knowledge mining in databases is presented at the end of theoretical part. The second part of the thesis is focused on the practical step by step application of the CRISP -DM methodology, which contains real data from the field of mobile communications. Data mining task used in practical part is the behavioral prediction of mobile carrier customers. Supporting the practical part of the thesis, IBM SPSS Modeler was used as a main software for knowledge mining. Key words: data mining, knowledge disvocery in databases. Churm management, prediction, CRISP-DM. |
Keywords: | CRISP-DM; prediction; churm management; knowledge disvocery in databases; data mining |
Information about study
Study programme: | Aplikovaná informatika/Znalostní technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 15. 11. 2012 |
---|---|
Date of submission: | 10. 5. 2013 |
Date of defense: | 9. 6. 2014 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/40348/podrobnosti |