Complementary Usage of OLAP and Data Mining Represented by GUHA Procedures

Thesis title: Complementary Usage of OLAP and Data Mining Represented by GUHA Procedures
Author: Borokshinova, Anastasia
Thesis type: Diploma thesis
Supervisor: Chudán, David
Opponents: Svátek, Vojtěch
Thesis language: English
Abstract:
This master thesis explores the possibilities for a complementary usage of OLAP and data mining represented by GUHA procedures. One of the main goals is to propose particular scenarios for its implementation, covering several GUHA procedures as part of data mining. Apart from this goal, the work also aims to design a general methodology helping with application of mentioned synergy. The data analysis is performed using Tableau and Lisp-Miner tools. In terms of data mining, LISp-Miner, CF-Miner, SD4ft-Miner and Ac4ft-Miner procedures are used. The whole process follows the CRISP-DM methodology. The theoretical part provides a brief description of the basic concepts and principles associated with both methods, their comparison and current research on the selected topic. The practical part demonstrates an accomplishment of the thesis’s goals. For practical implementation, Los Angeles crime data was used. The contributions of this thesis include: a proposal of scenarios covering complementary usage of CF-Miner, SD4ft-Miner and Ac4ft-Miner procedures and OLAP; a recommendation related to the usage of selected GUHA procedure in terms of these scenarios, and the design of a general methodology for an application of the mentioned synergy.
Keywords: OLAP; data mining; CRISP-DM; LISp-Miner; GUHA method; Business Intelligence
Thesis title: Complementary usage of OLAP and data mining represented by GUHA procedures
Author: Borokshinova, Anastasia
Thesis type: Diplomová práce
Supervisor: Chudán, David
Opponents: Svátek, Vojtěch
Thesis language: English
Abstract:
Tato diplomová práce se zabývá temátem komplementárního využití OLAP a data mining reprezentovaných GUHA procedurami. Prvním z cílů této práce je návrh několika scénářů pro implementaci tohoto řešení. Druhým cílem je pak návrh obecné metodologie, která se zaměřuje na aplikaci komplementárního využití obou dvou zkoumaných technik datové analýzy. Analýza dat je provedena pomocí nástrojů Tableau a LISp-Miner. Při práci s nástrojem LISp-Miner se využívají hlavně procedury CF-Miner, SD4ft-Miner a Ac4ft-Miner. Celý proces je řízený metodikou CRISP-DM. Teoretická část nabízí stručný popis základních pojmů a principů obou metod, jejich srovnání a přehled současného výzkumu ve vybraném tématu. Praktická část je založená na skutečných datech o kriminalitě v Americkém městě Los Angeles a soustředí se na naplnění cílů diplomové práce. Přínosem této práce je návrh scénářů, které by zahrnovaly komplementární využití OLAP a CF-Miner, SD4ft-Miner a Ac4ft-Miner GUHA procedur, doporučení týkající se využití vybraných procedur v rámci těchto scénářů a návrh obecné metodiky, která pomůže implementaci zmíněné synergie.
Keywords: OLAP; data mining; CRISP-DM; LISp-Miner; GUHA method; Business Intelligence

Information about study

Study programme: Aplikovaná informatika/Znalostní a webové technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 4. 4. 2019
Date of submission: 29. 4. 2019
Date of defense: 4. 6. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/69431/podrobnosti

Files for download

    Last update: