OLAP Recommender: Supporting Navigation in Data Cubes Using Association Rule Mining

Thesis title: OLAP Recommender: Supporting Navigation in Data Cubes Using Association Rule Mining
Author: Koukal, Bohuslav
Thesis type: Diploma thesis
Supervisor: Chudán, David
Opponents: Vojíř, Stanislav
Thesis language: English
Abstract:
Manual data exploration in data cubes and searching for potentially interesting and useful information starts to be time-consuming and ineffective from certain volume of the data. In my thesis, I designed, implemented and tested a system, automating the data cube exploration and offering potentially interesting views on OLAP data to the end user. The system is based on integration of two data analytics methods - OLAP analysis data visualisation and data mining, represented by GUHA association rules mining. Another contribution of my work is a research of possibilities how to solve differences between OLAP analysis and association rule mining. Implemented solutions of the differences include data discretization, dimensions commensurability, design of automatic data mining task algorithm based on the data structure and mapping definition between mined association rules and corresponding OLAP visualisation. The system was tested with real retail sales data and with EU structural funds data. The experiments proved that complementary usage of the association rule mining together with OLAP analysis identifies relationships in the data with higher success rate than the isolated use of both techniques.
Keywords: OLAP visualisation; OLAP navigation; OLAP analysis; association rules; data mining; mining aggregate data; recommender system; data cube; GUHA; OLAP Recommender
Thesis title: OLAP Recommender
Author: Koukal, Bohuslav
Thesis type: Diplomová práce
Supervisor: Chudán, David
Opponents: Vojíř, Stanislav
Thesis language: English
Abstract:
Manuální prozkoumávání agregovaných dat v datových kostkách a vyhledávání potenciálně užitečných informací je od určitého objemu dat časově náročné a neefektivní. V této práci jsem navrhnul, implementoval a na reálných datech otestoval systém, který prohledávání datové kostky automatizuje a nabízí uživateli potenciálně zajímavé pohledy na OLAP kostku. Systém je založen na propojení dvou metod datové analýzy - vizualizaci dat v OLAP analýze a dobývání znalostí z dat, reprezentovaném GUHA asociačními pravidly. Dalším přínosem práce je výzkum možností řešení rozdílů mezi OLAP analýzou a dolováním asociačních pravidel. Mezi implementačně řešené rozdíly patří především diskretizace dat, problém souměřitelnosti dimenzí, návrh automatického nastavení algoritmu pro dolování na základě struktury dat a definice provázání asociačních pravidel s OLAP vizualizací. Nástroj byl testován s reálnými maloobchodními prodejními daty a s daty o strukturálních fondech EU. Testování prokázalo, že propojení metod dolování asociačních pravidel a OLAP analýzy dokáže identifikovat zajímavé vztahy v datech s vyšší úspěšností než použití těchto metod samostatně.
Keywords: OLAP vizualizace; navigace v OLAP; OLAP analýza; asociační pravidla; datová kostka; doporučovací systém; OLAP Recommender; GUHA; vytěžování dat

Information about study

Study programme: Aplikovaná informatika/Znalostní a webové technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 14. 11. 2016
Date of submission: 26. 4. 2017
Date of defense: 7. 6. 2017
Identifier in the InSIS system: https://insis.vse.cz/zp/59645/podrobnosti

Files for download

    Last update: