Analysis of real data from Alza.cz product department using methods of KDD
Thesis title: | Analýza reálných dat produktové redakce Alza.cz pomocí metod DZD |
---|---|
Author: | Válek, Martin |
Thesis type: | Diplomová práce |
Supervisor: | Berka, Petr |
Opponents: | Kliegr, Tomáš |
Thesis language: | Česky |
Abstract: | Tato práce se zabývá analýzou dat pomocí metod dobývání znalostí z databází. Cílem je vybrat vhodné metody a nástroje a použít je pro realizaci konkrétního projektu založeného na reálných datech od produktové redakce společnosti Alza.cz. Analýza dat je prováděna pomocí asociačních pravidel a rozhodovacích pravidel v systému Lisp-Miner a pomocí rozhodovacích stromů v systému RapidMiner. Použitá metodika je CRISP-DM. Práce je rozdělena do třech hlavních částí. Úvodní část se zaměřuje na souhrn teoretických informací o dobývání znalostí z databází. Jsou zde definovány základní pojmy a popsány typy úloh a vybrané metody DZD použitelné pro praktickou část práce. Ve druhé části je představena metodologie CRISP-DM. V praktické části je nejprve představena společnost Alza.cz a její cíle pro tuto úlohu. Následně je popsána základní struktura dat a jejich příprava pro data miningovou úlohu, která po těchto krocích následuje. V závěru jsou vyhodnoceny získané výsledky a nastíněna možnost jejich využití. |
Keywords: | dobývání znalostí z databází; CRISP-DM; LISp-Miner; asociační pravidla |
Thesis title: | Analysis of real data from Alza.cz product department using methods of KDD |
---|---|
Author: | Válek, Martin |
Thesis type: | Diploma thesis |
Supervisor: | Berka, Petr |
Opponents: | Kliegr, Tomáš |
Thesis language: | Česky |
Abstract: | This thesis deals with data analysis using methods of knowledge discovery in databases. The goal is to select appropriate methods and tools for implementation of a specific project based on real data from Alza.cz product department. Data analysis is performed by using association rules and decision rules in the Lisp-Miner and decision trees in the RapidMiner. The methodology used is the CRISP-DM. The thesis is divided into three main sections. First section is focused on the theoretical summary of information about KDD. There are defined basic terms and described the types of tasks and methods of KDD. In the second section is introduced the methodology CRISP-DM. The practical part firstly introduces company Alza.cz and its goals for this task. Afterwards, the basic structure of the data and preparation for the next step (data mining) is described. In conclusion, the results are evaluated and the possibility of their use is outlined. |
Keywords: | CRISP-DM; LISp-Miner; association rules; knowledge discovery in databases |
Information about study
Study programme: | Aplikovaná informatika/Znalostní technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 25. 1. 2014 |
---|---|
Date of submission: | 10. 6. 2014 |
Date of defense: | 9. 6. 2014 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/46184/podrobnosti |