Analýza reálných dat produktové redakce Alza.cz pomocí metod DZD

Název práce: Analýza reálných dat produktové redakce Alza.cz pomocí metod DZD
Autor(ka) práce: Válek, Martin
Typ práce: Diplomová práce
Vedoucí práce: Berka, Petr
Oponenti práce: Kliegr, Tomáš
Jazyk práce: Česky
Abstrakt:
Tato práce se zabývá analýzou dat pomocí metod dobývání znalostí z databází. Cílem je vybrat vhodné metody a nástroje a použít je pro realizaci konkrétního projektu založeného na reálných datech od produktové redakce společnosti Alza.cz. Analýza dat je prováděna pomocí asociačních pravidel a rozhodovacích pravidel v systému Lisp-Miner a pomocí rozhodovacích stromů v systému RapidMiner. Použitá metodika je CRISP-DM. Práce je rozdělena do třech hlavních částí. Úvodní část se zaměřuje na souhrn teoretických informací o dobývání znalostí z databází. Jsou zde definovány základní pojmy a popsány typy úloh a vybrané metody DZD použitelné pro praktickou část práce. Ve druhé části je představena metodologie CRISP-DM. V praktické části je nejprve představena společnost Alza.cz a její cíle pro tuto úlohu. Následně je popsána základní struktura dat a jejich příprava pro data miningovou úlohu, která po těchto krocích následuje. V závěru jsou vyhodnoceny získané výsledky a nastíněna možnost jejich využití.
Klíčová slova: dobývání znalostí z databází; CRISP-DM; LISp-Miner; asociační pravidla
Název práce: Analysis of real data from Alza.cz product department using methods of KDD
Autor(ka) práce: Válek, Martin
Typ práce: Diploma thesis
Vedoucí práce: Berka, Petr
Oponenti práce: Kliegr, Tomáš
Jazyk práce: Česky
Abstrakt:
This thesis deals with data analysis using methods of knowledge discovery in databases. The goal is to select appropriate methods and tools for implementation of a specific project based on real data from Alza.cz product department. Data analysis is performed by using association rules and decision rules in the Lisp-Miner and decision trees in the RapidMiner. The methodology used is the CRISP-DM. The thesis is divided into three main sections. First section is focused on the theoretical summary of information about KDD. There are defined basic terms and described the types of tasks and methods of KDD. In the second section is introduced the methodology CRISP-DM. The practical part firstly introduces company Alza.cz and its goals for this task. Afterwards, the basic structure of the data and preparation for the next step (data mining) is described. In conclusion, the results are evaluated and the possibility of their use is outlined.
Klíčová slova: CRISP-DM; LISp-Miner; association rules; knowledge discovery in databases

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 25. 1. 2014
Datum podání práce: 10. 6. 2014
Datum obhajoby: 9. 6. 2014
Identifikátor v systému InSIS: https://insis.vse.cz/zp/46184/podrobnosti

Soubory ke stažení

    Poslední aktualizace: