Analýza dat z pojišťovnictví za použití OLAP a data miningu

Název práce: Analýza dat z pojišťovnictví za použití OLAP a data miningu
Autor(ka) práce: Dao, Hoang Nam
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Rauch, Jan
Jazyk práce: Česky
Abstrakt:
Cílem práce je demonstrovat využití kombinace OLAP a data miningu, za účelem vyhledání zajímavých vztahů v reálných datech z pojišťovnictví. Přestože jsou tyto metody odlišné a s jinými případovými užitími, jejich kombinací lze docílit synergického efektu. Práce se dělí na teoretickou a praktickou část. V teoretické části jsou přiblíženy oblasti Business Intelligence (BI) a dobývání znalostí z databází (DZD). Jsou představeny základní principy, definice, metody analýzy a používané metodiky. Dále jsou vymezeny rozdíly mezi OLAP analýzou a data miningem a představen způsob, jakým lze tyto dvě techniky analýzy kombinovat. Poslední teoretická kapitola se věnuje analytickým nástrojům, které jsou při analýze použity, konkrétně Power BI k OLAP analýze a akademický projekt LISp-Miner k data miningu. Praktická část obsahuje seznámení s problematikou pojišťovnictví, popis datasetu, jeho přípravu a detailní postup analýzy dat. Analyzovaný dataset patří firmě Respect, korporátnímu pojišťovacímu makléři a obsahuje zpracované pojistné události. Na konci práce jsou vyhodnoceny získané výsledky analýzy a na základě rozhovoru s datovým analytikem z firmy Respect je posouzeno, zda jsou zjištění vyplívající z analýzy relevantní. Na závěr je shrnuta celá práce a výsledky analýzy.
Klíčová slova: GUHA; OLAP; data mining; dataset; pojišťovnictví
Název práce: Analysis of Data from Insurance Industry Using OLAP and Data Mining
Autor(ka) práce: Dao, Hoang Nam
Typ práce: Bachelor thesis
Vedoucí práce: Chudán, David
Oponenti práce: Rauch, Jan
Jazyk práce: Česky
Abstrakt:
The aim of this thesis is to demonstrate the use of OLAP and data mining, in order to find interesting relationships in real data from the insurance industry. Although these methods are different and with other case applications, their combination can achieve a synergic effect. The thesis is divided into theoretical and practical part. The theoretical part introduces the areas of Business Intelligence (BI) and Knowledge Discovery in Databases (KDD). In this part, the basic principles, definitions, methods of analysis and methodologies are described. Furthermore, the differences between OLAP analysis and data mining are defined, followed by the explanation of a method, in which these two analysis techniques can be combined. The last theoretical chapter is devoted to analytical tools that are used during the analysis, namely Power BI for OLAP analysis and the academic project LISp-Miner for data mining. The practical part contains an introduction to the insurance industry, description of the dataset, its preparation and the process of data analysis. The analyzed dataset belongs to Respect, a corporate insurance broker and contains processed insurance events. At the end of the practical part of the thesis, the obtained results of analysis are evaluated. An interview is conducted with a data analyst from the company Respect. Based on this interview, it will be assessed, whether the findings of the analysis are relevant. In the closing part, the whole thesis and the results of the analysis are summarized.
Klíčová slova: data mining; dataset; insurance industry; OLAP; GUHA

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 14. 9. 2020
Datum podání práce: 8. 5. 2021
Datum obhajoby: 15. 6. 2021
Identifikátor v systému InSIS: https://insis.vse.cz/zp/74069/podrobnosti

Soubory ke stažení

    Poslední aktualizace: