Combining OLAP and data mining for analysis on trainee dataset

Thesis title: Propojení OLAPu a data miningu při analýze cvičného datasetu
Author: Borokshinova, Anastasia
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Šimůnek, Milan
Thesis language: Česky
Abstract:
Cílem této práce je ukázat možnost propojení dvou technik datové analýzy OLAP a data mining v určité oblasti. Základním způsobem dosažení cíle bude průběžné porovnávání a kontrola získaných výsledků pomocí již zmíněných technik. Pro praktickou aplikaci daného způsobu je použit cvičný dataset o úvěrech poskytnutých fyzickým osobám. Analýza dat bude prováděna pomocí doplňku MS Excelu Power Pivot a systému LISp-Miner. Při práci s LISp-Minerem bude využita konkrétně procedura 4ft-Miner, která postupuje podle uznávané data miningové metodiky CRISP-DM. Přínos práce spočívá především v představení možností propojení OLAP a data miningu na stejném datasetu, a tím omezení počtu možných mylných závěrů, ke kterým by analytici mohli dospět pouze na základě jedné z technik. Dalšími přínosy je ukázka převedení relačních dat do multidimenzionální struktury a praktické možnosti využití procedury 4ft-Miner systému LISp-Miner.
Keywords: OLAP; data mining; asociační pravidla; CRISP-DM; LISp-Miner; Business Intelligence
Thesis title: Combining OLAP and data mining for analysis on trainee dataset
Author: Borokshinova, Anastasia
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Šimůnek, Milan
Thesis language: Česky
Abstract:
The aim of this thesis is to show the possibility of combining two data analyses techniques OLAP and data mining in a certain area. The principal method of achieving the aim will be continuous comparison and check of acquired results using two techniques. A practise dataset on credits provided to physical persons is used for practical application. The data analysis will be performed using Power Pivot MS Excel complement and LISp-Miner system. For work with LISp-System the 4ft Miner procedure will specifically be used, which proceeds according to respected CRISP-DM data mining methodology. The thesis added value consists first of all in presentation of a possibility of OLAP and data mining linkage on the same dataset, thus reducing the number of erroneous conclusions which analysers might arrive at on the basis of one technique. Other benefits consist in presentation of relational data transfer to multi-dimensional structure and practical options of 4ft-Miner system LISp-Miner procedure usage.
Keywords: association rules; CRISP-DM; LISp-Miner; Business Intelligence; OLAP; data mining

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 9. 2. 2015
Date of submission: 6. 5. 2015
Date of defense: 22. 6. 2015
Identifier in the InSIS system: https://insis.vse.cz/zp/51159/podrobnosti

Files for download

    Last update: