Analysis of Data from Insurance Industry Using OLAP and Data Mining

Thesis title: Analýza dat z pojišťovnictví za použití OLAP a data miningu
Author: Dao, Hoang Nam
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Rauch, Jan
Thesis language: Česky
Abstract:
Cílem práce je demonstrovat využití kombinace OLAP a data miningu, za účelem vyhledání zajímavých vztahů v reálných datech z pojišťovnictví. Přestože jsou tyto metody odlišné a s jinými případovými užitími, jejich kombinací lze docílit synergického efektu. Práce se dělí na teoretickou a praktickou část. V teoretické části jsou přiblíženy oblasti Business Intelligence (BI) a dobývání znalostí z databází (DZD). Jsou představeny základní principy, definice, metody analýzy a používané metodiky. Dále jsou vymezeny rozdíly mezi OLAP analýzou a data miningem a představen způsob, jakým lze tyto dvě techniky analýzy kombinovat. Poslední teoretická kapitola se věnuje analytickým nástrojům, které jsou při analýze použity, konkrétně Power BI k OLAP analýze a akademický projekt LISp-Miner k data miningu. Praktická část obsahuje seznámení s problematikou pojišťovnictví, popis datasetu, jeho přípravu a detailní postup analýzy dat. Analyzovaný dataset patří firmě Respect, korporátnímu pojišťovacímu makléři a obsahuje zpracované pojistné události. Na konci práce jsou vyhodnoceny získané výsledky analýzy a na základě rozhovoru s datovým analytikem z firmy Respect je posouzeno, zda jsou zjištění vyplívající z analýzy relevantní. Na závěr je shrnuta celá práce a výsledky analýzy.
Keywords: GUHA; OLAP; data mining; dataset; pojišťovnictví
Thesis title: Analysis of Data from Insurance Industry Using OLAP and Data Mining
Author: Dao, Hoang Nam
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Rauch, Jan
Thesis language: Česky
Abstract:
The aim of this thesis is to demonstrate the use of OLAP and data mining, in order to find interesting relationships in real data from the insurance industry. Although these methods are different and with other case applications, their combination can achieve a synergic effect. The thesis is divided into theoretical and practical part. The theoretical part introduces the areas of Business Intelligence (BI) and Knowledge Discovery in Databases (KDD). In this part, the basic principles, definitions, methods of analysis and methodologies are described. Furthermore, the differences between OLAP analysis and data mining are defined, followed by the explanation of a method, in which these two analysis techniques can be combined. The last theoretical chapter is devoted to analytical tools that are used during the analysis, namely Power BI for OLAP analysis and the academic project LISp-Miner for data mining. The practical part contains an introduction to the insurance industry, description of the dataset, its preparation and the process of data analysis. The analyzed dataset belongs to Respect, a corporate insurance broker and contains processed insurance events. At the end of the practical part of the thesis, the obtained results of analysis are evaluated. An interview is conducted with a data analyst from the company Respect. Based on this interview, it will be assessed, whether the findings of the analysis are relevant. In the closing part, the whole thesis and the results of the analysis are summarized.
Keywords: data mining; dataset; insurance industry; OLAP; GUHA

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 14. 9. 2020
Date of submission: 8. 5. 2021
Date of defense: 15. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/74069/podrobnosti

Files for download

    Last update: