Data mining in real data

Thesis title: Data mining v reálných datech
Author: Kozohorský, Vladimír
Thesis type: Bakalářská práce
Supervisor: Rauch, Jan
Opponents: Chudán, David
Thesis language: Česky
Abstract:
Bakalářská práce se zaměřuje na dobývání znalostí z databází a jeho praktické využití na reálných datech. Důraz se klade hlavně na praktickou část, kde se pomocí programu LISp-Miner dobývají znalosti z rozsáhlého souboru dat serveru Kickstarter.com, což je platforma pro financování různých druhů projektů veřejností. Dále se praktická část bakalářské práce zabývá vysvětlením výsledků, a jejich co nejlepší interpretaci, včetně různých doporučení.Teoretická část práce se zabývá vysvětlením potřebných teoretických znalostí pro pochopení postupů v praktické části. Jako první je čtenář uveden do oboru data mining a krátce také do jeho historie. Dále se práce zabývá metodikou CRISP-DM a metodou GUHA. Jako další jsou vysvětleny základy booleovských atributů a asociačních pravidel. Závěrem teoretické části práce je představení systému LISp-Miner a procedurou 4ft-Miner, která je použita v praktické části při dobývání znalostí.
Keywords: Kickstarter; 4ft-Miner; dobývání znalostí z databází; LISp-Miner; Data mining
Thesis title: Data mining in real data
Author: Kozohorský, Vladimír
Thesis type: Bachelor thesis
Supervisor: Rauch, Jan
Opponents: Chudán, David
Thesis language: Česky
Abstract:
This bachelor thesis focuses on data mining from databases and its practical use in real data. The main emphasis of this thesis is mainly on practical part, which is the data mining itself. The program that is used for the mining, of the extensive data, is LISp-Miner. The data that are used for the mining are from server Kickstarter.com, which is a crowd funding platform for all kinds of projects. Another major part of thesis belongs to interpretation of the results that came from data mining.Theoretical part of the thesis is trying to explain the basics of data mining, so that the reader can understand the practical part of the thesis. At first, the reader gets to know the basics of data mining and a little bit about its history. Hereafter is an explanation of the main methodology principle for data mining, called CRISP-DM. The most important portion of the theoretical part is about czech method called GUHA, association rules and boolean attributes. Last but not least is the part dedicated to LISp-Miner and 4ft-Miner procedure which are heavily used in practical part of thesis.
Keywords: 4ft-Miner; LISp-Miner; Kickstarter; Data mining

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 1. 2. 2018
Date of submission: 26. 4. 2018
Date of defense: 14. 6. 2018
Identifier in the InSIS system: https://insis.vse.cz/zp/64636/podrobnosti

Files for download

    Last update: