OLAP Recommender: Supporting Navigation in Data Cubes Using Association Rule Mining
Thesis title: | OLAP Recommender: Supporting Navigation in Data Cubes Using Association Rule Mining |
---|---|
Author: | Koukal, Bohuslav |
Thesis type: | Diploma thesis |
Supervisor: | Chudán, David |
Opponents: | Vojíř, Stanislav |
Thesis language: | English |
Abstract: | Manual data exploration in data cubes and searching for potentially interesting and useful information starts to be time-consuming and ineffective from certain volume of the data. In my thesis, I designed, implemented and tested a system, automating the data cube exploration and offering potentially interesting views on OLAP data to the end user.
The system is based on integration of two data analytics methods - OLAP analysis data visualisation and data mining, represented by GUHA association rules mining. Another contribution of my work is a research of possibilities how to solve differences between OLAP analysis and association rule mining. Implemented solutions of the differences include data discretization, dimensions commensurability, design of automatic data mining task algorithm based on the data structure and mapping definition between mined association rules and corresponding OLAP visualisation.
The system was tested with real retail sales data and with EU structural funds data. The experiments proved that complementary usage of the association rule mining together with OLAP analysis identifies relationships in the data with higher success rate than the isolated use of both techniques. |
Keywords: | OLAP visualisation; OLAP navigation; OLAP analysis; association rules; data mining; mining aggregate data; recommender system; data cube; GUHA; OLAP Recommender |
Thesis title: | OLAP Recommender |
---|---|
Author: | Koukal, Bohuslav |
Thesis type: | Diplomová práce |
Supervisor: | Chudán, David |
Opponents: | Vojíř, Stanislav |
Thesis language: | English |
Abstract: | Manuální prozkoumávání agregovaných dat v datových kostkách a vyhledávání potenciálně užitečných informací je od určitého objemu dat časově náročné a neefektivní. V této práci jsem navrhnul, implementoval a na reálných datech otestoval systém, který prohledávání datové kostky automatizuje a nabízí uživateli potenciálně zajímavé pohledy na OLAP kostku.
Systém je založen na propojení dvou metod datové analýzy - vizualizaci dat v OLAP analýze a dobývání znalostí z dat, reprezentovaném GUHA asociačními pravidly. Dalším přínosem práce je výzkum možností řešení rozdílů mezi OLAP analýzou a dolováním asociačních pravidel. Mezi implementačně řešené rozdíly patří především diskretizace dat, problém souměřitelnosti dimenzí, návrh automatického nastavení algoritmu pro dolování na základě struktury dat a definice provázání asociačních pravidel s OLAP vizualizací.
Nástroj byl testován s reálnými maloobchodními prodejními daty a s daty o strukturálních fondech EU. Testování prokázalo, že propojení metod dolování asociačních pravidel a OLAP analýzy dokáže identifikovat zajímavé vztahy v datech s vyšší úspěšností než použití těchto metod samostatně. |
Keywords: | OLAP vizualizace; navigace v OLAP; OLAP analýza; asociační pravidla; datová kostka; doporučovací systém; OLAP Recommender; GUHA; vytěžování dat |
Information about study
Study programme: | Aplikovaná informatika/Znalostní a webové technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 14. 11. 2016 |
---|---|
Date of submission: | 26. 4. 2017 |
Date of defense: | 7. 6. 2017 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/59645/podrobnosti |