Options of presentation of KDD results on Web
Thesis title: | Možnosti prezentace výsledků DZD na webu |
---|---|
Author: | Koválik, Tomáš |
Thesis type: | Diplomová práce |
Supervisor: | Rauch, Jan |
Opponents: | Šimůnek, Milan |
Thesis language: | Česky |
Abstract: | Diplomová práce se zabývá DZD analýzou dat a způsoby prezentace výsledků DZD na webu. Práce je členěna do tří hlavních částí, které na sebe navazují a kopírují průběh celé práce. První část práce obsahuje teoretický základ, potřebný pro pochopení probírané problematiky. Je zde popsána metodika CRISP-DM, jsou zde definovány pojmy matice dat a doménové znalosti, je zde představena metoda GUHA, systém LISp-Miner a implementace metody GUHA v systému LISp-Miner včetně popis pro tuto práci stěžejních procedur 4ft-Miner a CF-Miner. Druhá část práce je zaměřená na zpracování prvního cíle práce. Stručně se věnuje popisu provedené preanalýzy a následně je zde popsán postup během analýzy doménových znalostí ve vybrané datové sadě. V třetí části práce je následně řešen druhý cíl práce, problém prezentace výsledků DZD na webu. Třetí část práce obsahuje stručný teoretický základ k vybraným technologiím. Následně je zde popsána práce při tvorbě automatického exportu výsledků DZD do formátu HTML včetně struktury výstupu a doporučení pro práci se systémem LISp-Miner. |
Keywords: | GUHA; LISp-Miner; Asociační pravidla; doménové znalosti; CF-Miner; export; CRISP-DM; kriminální činy; Chicago; HTML; Highcharts; DZD; LM Exec; LMCL; 4ft-Miner |
Thesis title: | Options of presentation of KDD results on Web |
---|---|
Author: | Koválik, Tomáš |
Thesis type: | Diploma thesis |
Supervisor: | Rauch, Jan |
Opponents: | Šimůnek, Milan |
Thesis language: | Česky |
Abstract: | This diploma thesis covers KDD analysis of data and options of presentation of KDD results on Web. The paper is divided into three main sections, which follow the whole process of this thesis. In the first section are mentioned theoretical basics needed for understanding of discussed problem. In this section are described notions data matrix and domain knowledge, concept of CRISP-DM methodology, GUHA method, system LISp-Miner and implementation of GUHA method in LISp-Miner including description of core procedures 4ft-Miner and CF-Miner. The second section is dedicated to the first goal of this paper. It briefly summarizes analysis made during pre-analysis phase. Then is described process of analysis of domain knowledge in a given data set. The third part focuses on the second goal of this thesis, which is problem of presentation of KDD results on Web. This section covers brief theoretical basis for used technologies. Then is described development of export script for automatic generation of website from results found using LISp-Miner system including description of structure of the output and recommendations for work in LISp-Miner system. |
Keywords: | CF-Miner; domain knowledge; crimes; 4ft-Miner; GUHA; export; LM Exec; CRISP-DM; LISp-Miner; HTML; Highcharts; Chicago; association rules; KDD; LMCL |
Information about study
Study programme: | Aplikovaná informatika/Znalostní technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 28. 1. 2015 |
---|---|
Date of submission: | 29. 4. 2015 |
Date of defense: | 3. 2. 2016 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/51002/podrobnosti |