Analýza reálných dat produktové redakce Alza.cz pomocí metod DZD
Název práce: | Analýza reálných dat produktové redakce Alza.cz pomocí metod DZD |
---|---|
Autor(ka) práce: | Válek, Martin |
Typ práce: | Diplomová práce |
Vedoucí práce: | Berka, Petr |
Oponenti práce: | Kliegr, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | Tato práce se zabývá analýzou dat pomocí metod dobývání znalostí z databází. Cílem je vybrat vhodné metody a nástroje a použít je pro realizaci konkrétního projektu založeného na reálných datech od produktové redakce společnosti Alza.cz. Analýza dat je prováděna pomocí asociačních pravidel a rozhodovacích pravidel v systému Lisp-Miner a pomocí rozhodovacích stromů v systému RapidMiner. Použitá metodika je CRISP-DM. Práce je rozdělena do třech hlavních částí. Úvodní část se zaměřuje na souhrn teoretických informací o dobývání znalostí z databází. Jsou zde definovány základní pojmy a popsány typy úloh a vybrané metody DZD použitelné pro praktickou část práce. Ve druhé části je představena metodologie CRISP-DM. V praktické části je nejprve představena společnost Alza.cz a její cíle pro tuto úlohu. Následně je popsána základní struktura dat a jejich příprava pro data miningovou úlohu, která po těchto krocích následuje. V závěru jsou vyhodnoceny získané výsledky a nastíněna možnost jejich využití. |
Klíčová slova: | dobývání znalostí z databází; CRISP-DM; LISp-Miner; asociační pravidla |
Název práce: | Analysis of real data from Alza.cz product department using methods of KDD |
---|---|
Autor(ka) práce: | Válek, Martin |
Typ práce: | Diploma thesis |
Vedoucí práce: | Berka, Petr |
Oponenti práce: | Kliegr, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | This thesis deals with data analysis using methods of knowledge discovery in databases. The goal is to select appropriate methods and tools for implementation of a specific project based on real data from Alza.cz product department. Data analysis is performed by using association rules and decision rules in the Lisp-Miner and decision trees in the RapidMiner. The methodology used is the CRISP-DM. The thesis is divided into three main sections. First section is focused on the theoretical summary of information about KDD. There are defined basic terms and described the types of tasks and methods of KDD. In the second section is introduced the methodology CRISP-DM. The practical part firstly introduces company Alza.cz and its goals for this task. Afterwards, the basic structure of the data and preparation for the next step (data mining) is described. In conclusion, the results are evaluated and the possibility of their use is outlined. |
Klíčová slova: | CRISP-DM; LISp-Miner; association rules; knowledge discovery in databases |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Znalostní technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 25. 1. 2014 |
---|---|
Datum podání práce: | 10. 6. 2014 |
Datum obhajoby: | 9. 6. 2014 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/46184/podrobnosti |