Data mining v reálných datech

Název práce: Data mining v reálných datech
Autor(ka) práce: Kozohorský, Vladimír
Typ práce: Bakalářská práce
Vedoucí práce: Rauch, Jan
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
Bakalářská práce se zaměřuje na dobývání znalostí z databází a jeho praktické využití na reálných datech. Důraz se klade hlavně na praktickou část, kde se pomocí programu LISp-Miner dobývají znalosti z rozsáhlého souboru dat serveru Kickstarter.com, což je platforma pro financování různých druhů projektů veřejností. Dále se praktická část bakalářské práce zabývá vysvětlením výsledků, a jejich co nejlepší interpretaci, včetně různých doporučení.Teoretická část práce se zabývá vysvětlením potřebných teoretických znalostí pro pochopení postupů v praktické části. Jako první je čtenář uveden do oboru data mining a krátce také do jeho historie. Dále se práce zabývá metodikou CRISP-DM a metodou GUHA. Jako další jsou vysvětleny základy booleovských atributů a asociačních pravidel. Závěrem teoretické části práce je představení systému LISp-Miner a procedurou 4ft-Miner, která je použita v praktické části při dobývání znalostí.
Klíčová slova: Kickstarter; 4ft-Miner; dobývání znalostí z databází; LISp-Miner; Data mining
Název práce: Data mining in real data
Autor(ka) práce: Kozohorský, Vladimír
Typ práce: Bachelor thesis
Vedoucí práce: Rauch, Jan
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
This bachelor thesis focuses on data mining from databases and its practical use in real data. The main emphasis of this thesis is mainly on practical part, which is the data mining itself. The program that is used for the mining, of the extensive data, is LISp-Miner. The data that are used for the mining are from server Kickstarter.com, which is a crowd funding platform for all kinds of projects. Another major part of thesis belongs to interpretation of the results that came from data mining.Theoretical part of the thesis is trying to explain the basics of data mining, so that the reader can understand the practical part of the thesis. At first, the reader gets to know the basics of data mining and a little bit about its history. Hereafter is an explanation of the main methodology principle for data mining, called CRISP-DM. The most important portion of the theoretical part is about czech method called GUHA, association rules and boolean attributes. Last but not least is the part dedicated to LISp-Miner and 4ft-Miner procedure which are heavily used in practical part of thesis.
Klíčová slova: 4ft-Miner; LISp-Miner; Kickstarter; Data mining

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 1. 2. 2018
Datum podání práce: 26. 4. 2018
Datum obhajoby: 14. 6. 2018
Identifikátor v systému InSIS: https://insis.vse.cz/zp/64636/podrobnosti

Soubory ke stažení

    Poslední aktualizace: