The real task of data mining

Thesis title: Reálná úloha dobývání znalostí
Author: Trondin, Anton
Thesis type: Diplomová práce
Supervisor: Berka, Petr
Opponents: Chudán, David
Thesis language: Česky
Abstract:
Diplomová práce nese název "Reálná úloha dobývání znalostí", bude rozdělena na dvě velké části, a to na teoretickou a praktickou. V praktické části jsou popsané základní pojmy data mining, jednotlivé metody a typy úloh používaných pří dobývání znalosti z databáze a algoritmy relevantní pro tuto oblast problematiky. Velká kapitola je věnovaná metodice CRISP-DM a jednotlivým fázím dobývání znalostí z databáze, která bude použitá jako hlavní metodika při realizace praktické části diplomové práce, přičemž nebude zapomenuto i na ostatní méně známé a používané metodiky z dané oblasti. Na závěr teoretické části je prezentován seznam, jak placeného, tak volně dostupného softwaru, který lze použit pro dobývání znalostí z databáze. Druhá velká část diplomové práce se bude věnovat praktickému použití metodiky CRISP-DM podle jednotlivých kroků, které obsahuje nad reálnými daty z oblasti mobilní telekomunikace. Hlavní data mining úloha, která se řeší v praktické části, je predikce odhadu zákazníků mobilního operátora. Software pro dobývání znalostí z databáze byl zvolen mně známy IBM SPSS Modeler. Klíčová slova: data mining, dobývání znalostí z databáze, churn management, predikce, CRISP-DM
Keywords: predikce; churn management; dobývání znalostí z databáze; data mining; CRISP-DM
Thesis title: The real task of data mining
Author: Trondin, Anton
Thesis type: Diploma thesis
Supervisor: Berka, Petr
Opponents: Chudán, David
Thesis language: Česky
Abstract:
Diploma thesis " The real role of knowledge mining " is divided into two major parts, the theoretical and the practical. The practical part describes the basic concepts of data mining, various methods and types of tasks used for knowledge discovery in databases and algorithms used in this area . Main focus is devoted to the CRISP -DM methodology and to various stages of knowledge discovery from databases. This methodology will be later used as the basis for practical part of the thesis while other less known methods used for data mining won`t be neglected. List of paid and free software which can be used for knowledge mining in databases is presented at the end of theoretical part. The second part of the thesis is focused on the practical step by step application of the CRISP -DM methodology, which contains real data from the field of mobile communications. Data mining task used in practical part is the behavioral prediction of mobile carrier customers. Supporting the practical part of the thesis, IBM SPSS Modeler was used as a main software for knowledge mining. Key words: data mining, knowledge disvocery in databases. Churm management, prediction, CRISP-DM.
Keywords: CRISP-DM; prediction; churm management; knowledge disvocery in databases; data mining

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 15. 11. 2012
Date of submission: 10. 5. 2013
Date of defense: 9. 6. 2014
Identifier in the InSIS system: https://insis.vse.cz/zp/40348/podrobnosti

Files for download

    Last update: