Reálná úloha dobývání znalostí v pojišťovnictví

Název práce: Reálná úloha dobývání znalostí v pojišťovnictví
Autor(ka) práce: Večerek, Jan
Typ práce: Diplomová práce
Vedoucí práce: Berka, Petr
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
Diplomová práce řeší reálnou úlohu přiřazení pojistných událostí na likvidátory dle metod dobývání znalostí z databází. Cílem práce je zjištění, zda je možné využít dobývání znalostí z databází k řešení problému přiřazení pojistných událostí. Celý proces k dosažení cíle se řídí metodikou CRISP-DM a skládá se z následujících kroků: porozumění problematice, porozumění datům, příprava dat, modelování a využití modelů. První část práce je věnována teoretickému kontextu dobývání znalostí z databází. Součástí je popis metodiky CRISP-DM, představení úloh řešitelných pomocí dobývání znalostí a také modely pro řešení úlohy klasifikace. Spolu s modely jsou popsány i způsoby testování klasifikačních modelů a základy datové analýzy. Reálná úloha řeší problematiku přiřazení pojistných událostí na likvidátory v momentě zaregistrování pojistné událostí. Řešení úlohy je založeno na knihovnách programovacího jazyku Python a jsou využívány modely pro úlohu klasifikace jako jsou CART, RandomForest, ExtraTreesClassifier, Multilayer Perceptron, Logistická regrese, K-nejbližších sousedů a Support Vector Machines. Celkem je testováno 19 kombinací modelů na 4 různých datasetech, které byly vytvořeny na základě získaných reálných datech o pojistných událostech. Ze všech modelů se pro řešení dané klasifikační úlohy ukázaly jako nejvhodnější algoritmy pokročilých rozhodovacích stromů RandomForest a ExtraTreesClassifier.
Klíčová slova: Dobývání znalostí z databází; dolování dat; strojové učení; klasifikace; pojistné události
Název práce: Application of knowledge discovery in the insurance industry
Autor(ka) práce: Večerek, Jan
Typ práce: Diploma thesis
Vedoucí práce: Berka, Petr
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
This thesis deals with a real role of classifying claims to the appropriate solver done by a method of knowledge discovery. The aim of this thesis is to find the right solutions for data mining problem of classifying claims. CRISP-DM methodology is applied to a data mining process which contains business understanding, data understanding, data preparation, modelling and evaluation. This thesis is divided into two main parts – theoretical and practical. The first part presents theoretical framework of knowledge discovery including methodology CRISP-DM, data mining roles and data mining models for a classification role. The second part aims to classify claims to the specific insurance assessor at the moment of claim registration. The solution is based on libraries of programming language Python. Classification models such as CART, RandomForest, ExtraTreesClassifier, Multilayer Perceptron, Logistic regression, K-nearest neighbors and Support Vector Machines are applied. In total 19 models are tested on 4 different datasets containing real claims data. Two certain complex models, RandomForest and ExtraTreesClassifier, are considered to be the most suitable solutions for the classification role.
Klíčová slova: Knowledge discovery in databases; data mining; insurance claims; machine learning; classification

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Podniková informatika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 2. 11. 2020
Datum podání práce: 30. 4. 2021
Datum obhajoby: 2. 6. 2021
Identifikátor v systému InSIS: https://insis.vse.cz/zp/74962/podrobnosti

Soubory ke stažení

    Poslední aktualizace: