Options of presentation of KDD results on Web

Thesis title: Možnosti prezentace výsledků DZD na webu
Author: Koválik, Tomáš
Thesis type: Diplomová práce
Supervisor: Rauch, Jan
Opponents: Šimůnek, Milan
Thesis language: Česky
Abstract:
Diplomová práce se zabývá DZD analýzou dat a způsoby prezentace výsledků DZD na webu. Práce je členěna do tří hlavních částí, které na sebe navazují a kopírují průběh celé práce. První část práce obsahuje teoretický základ, potřebný pro pochopení probírané problematiky. Je zde popsána metodika CRISP-DM, jsou zde definovány pojmy matice dat a doménové znalosti, je zde představena metoda GUHA, systém LISp-Miner a implementace metody GUHA v systému LISp-Miner včetně popis pro tuto práci stěžejních procedur 4ft-Miner a CF-Miner. Druhá část práce je zaměřená na zpracování prvního cíle práce. Stručně se věnuje popisu provedené preanalýzy a následně je zde popsán postup během analýzy doménových znalostí ve vybrané datové sadě. V třetí části práce je následně řešen druhý cíl práce, problém prezentace výsledků DZD na webu. Třetí část práce obsahuje stručný teoretický základ k vybraným technologiím. Následně je zde popsána práce při tvorbě automatického exportu výsledků DZD do formátu HTML včetně struktury výstupu a doporučení pro práci se systémem LISp-Miner.
Keywords: GUHA; LISp-Miner; Asociační pravidla; doménové znalosti; CF-Miner; export; CRISP-DM; kriminální činy; Chicago; HTML; Highcharts; DZD; LM Exec; LMCL; 4ft-Miner
Thesis title: Options of presentation of KDD results on Web
Author: Koválik, Tomáš
Thesis type: Diploma thesis
Supervisor: Rauch, Jan
Opponents: Šimůnek, Milan
Thesis language: Česky
Abstract:
This diploma thesis covers KDD analysis of data and options of presentation of KDD results on Web. The paper is divided into three main sections, which follow the whole process of this thesis. In the first section are mentioned theoretical basics needed for understanding of discussed problem. In this section are described notions data matrix and domain knowledge, concept of CRISP-DM methodology, GUHA method, system LISp-Miner and implementation of GUHA method in LISp-Miner including description of core procedures 4ft-Miner and CF-Miner. The second section is dedicated to the first goal of this paper. It briefly summarizes analysis made during pre-analysis phase. Then is described process of analysis of domain knowledge in a given data set. The third part focuses on the second goal of this thesis, which is problem of presentation of KDD results on Web. This section covers brief theoretical basis for used technologies. Then is described development of export script for automatic generation of website from results found using LISp-Miner system including description of structure of the output and recommendations for work in LISp-Miner system.
Keywords: CF-Miner; domain knowledge; crimes; 4ft-Miner; GUHA; export; LM Exec; CRISP-DM; LISp-Miner; HTML; Highcharts; Chicago; association rules; KDD; LMCL

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 28. 1. 2015
Date of submission: 29. 4. 2015
Date of defense: 3. 2. 2016
Identifier in the InSIS system: https://insis.vse.cz/zp/51002/podrobnosti

Files for download

    Last update: