Analysis of real data from Alza.cz product department using methods of KDD

Thesis title: Analýza reálných dat produktové redakce Alza.cz pomocí metod DZD
Author: Válek, Martin
Thesis type: Diplomová práce
Supervisor: Berka, Petr
Opponents: Kliegr, Tomáš
Thesis language: Česky
Abstract:
Tato práce se zabývá analýzou dat pomocí metod dobývání znalostí z databází. Cílem je vybrat vhodné metody a nástroje a použít je pro realizaci konkrétního projektu založeného na reálných datech od produktové redakce společnosti Alza.cz. Analýza dat je prováděna pomocí asociačních pravidel a rozhodovacích pravidel v systému Lisp-Miner a pomocí rozhodovacích stromů v systému RapidMiner. Použitá metodika je CRISP-DM. Práce je rozdělena do třech hlavních částí. Úvodní část se zaměřuje na souhrn teoretických informací o dobývání znalostí z databází. Jsou zde definovány základní pojmy a popsány typy úloh a vybrané metody DZD použitelné pro praktickou část práce. Ve druhé části je představena metodologie CRISP-DM. V praktické části je nejprve představena společnost Alza.cz a její cíle pro tuto úlohu. Následně je popsána základní struktura dat a jejich příprava pro data miningovou úlohu, která po těchto krocích následuje. V závěru jsou vyhodnoceny získané výsledky a nastíněna možnost jejich využití.
Keywords: dobývání znalostí z databází; CRISP-DM; LISp-Miner; asociační pravidla
Thesis title: Analysis of real data from Alza.cz product department using methods of KDD
Author: Válek, Martin
Thesis type: Diploma thesis
Supervisor: Berka, Petr
Opponents: Kliegr, Tomáš
Thesis language: Česky
Abstract:
This thesis deals with data analysis using methods of knowledge discovery in databases. The goal is to select appropriate methods and tools for implementation of a specific project based on real data from Alza.cz product department. Data analysis is performed by using association rules and decision rules in the Lisp-Miner and decision trees in the RapidMiner. The methodology used is the CRISP-DM. The thesis is divided into three main sections. First section is focused on the theoretical summary of information about KDD. There are defined basic terms and described the types of tasks and methods of KDD. In the second section is introduced the methodology CRISP-DM. The practical part firstly introduces company Alza.cz and its goals for this task. Afterwards, the basic structure of the data and preparation for the next step (data mining) is described. In conclusion, the results are evaluated and the possibility of their use is outlined.
Keywords: CRISP-DM; LISp-Miner; association rules; knowledge discovery in databases

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 25. 1. 2014
Date of submission: 10. 6. 2014
Date of defense: 9. 6. 2014
Identifier in the InSIS system: https://insis.vse.cz/zp/46184/podrobnosti

Files for download

    Last update: