Reálná úloha dobývání znalostí v pojišťovnictví
Název práce: | Reálná úloha dobývání znalostí v pojišťovnictví |
---|---|
Autor(ka) práce: | Večerek, Jan |
Typ práce: | Diplomová práce |
Vedoucí práce: | Berka, Petr |
Oponenti práce: | Chudán, David |
Jazyk práce: | Česky |
Abstrakt: | Diplomová práce řeší reálnou úlohu přiřazení pojistných událostí na likvidátory dle metod dobývání znalostí z databází. Cílem práce je zjištění, zda je možné využít dobývání znalostí z databází k řešení problému přiřazení pojistných událostí. Celý proces k dosažení cíle se řídí metodikou CRISP-DM a skládá se z následujících kroků: porozumění problematice, porozumění datům, příprava dat, modelování a využití modelů. První část práce je věnována teoretickému kontextu dobývání znalostí z databází. Součástí je popis metodiky CRISP-DM, představení úloh řešitelných pomocí dobývání znalostí a také modely pro řešení úlohy klasifikace. Spolu s modely jsou popsány i způsoby testování klasifikačních modelů a základy datové analýzy. Reálná úloha řeší problematiku přiřazení pojistných událostí na likvidátory v momentě zaregistrování pojistné událostí. Řešení úlohy je založeno na knihovnách programovacího jazyku Python a jsou využívány modely pro úlohu klasifikace jako jsou CART, RandomForest, ExtraTreesClassifier, Multilayer Perceptron, Logistická regrese, K-nejbližších sousedů a Support Vector Machines. Celkem je testováno 19 kombinací modelů na 4 různých datasetech, které byly vytvořeny na základě získaných reálných datech o pojistných událostech. Ze všech modelů se pro řešení dané klasifikační úlohy ukázaly jako nejvhodnější algoritmy pokročilých rozhodovacích stromů RandomForest a ExtraTreesClassifier. |
Klíčová slova: | Dobývání znalostí z databází; dolování dat; strojové učení; klasifikace; pojistné události |
Název práce: | Application of knowledge discovery in the insurance industry |
---|---|
Autor(ka) práce: | Večerek, Jan |
Typ práce: | Diploma thesis |
Vedoucí práce: | Berka, Petr |
Oponenti práce: | Chudán, David |
Jazyk práce: | Česky |
Abstrakt: | This thesis deals with a real role of classifying claims to the appropriate solver done by a method of knowledge discovery. The aim of this thesis is to find the right solutions for data mining problem of classifying claims. CRISP-DM methodology is applied to a data mining process which contains business understanding, data understanding, data preparation, modelling and evaluation. This thesis is divided into two main parts – theoretical and practical. The first part presents theoretical framework of knowledge discovery including methodology CRISP-DM, data mining roles and data mining models for a classification role. The second part aims to classify claims to the specific insurance assessor at the moment of claim registration. The solution is based on libraries of programming language Python. Classification models such as CART, RandomForest, ExtraTreesClassifier, Multilayer Perceptron, Logistic regression, K-nearest neighbors and Support Vector Machines are applied. In total 19 models are tested on 4 different datasets containing real claims data. Two certain complex models, RandomForest and ExtraTreesClassifier, are considered to be the most suitable solutions for the classification role. |
Klíčová slova: | Knowledge discovery in databases; data mining; insurance claims; machine learning; classification |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Podniková informatika |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 2. 11. 2020 |
---|---|
Datum podání práce: | 30. 4. 2021 |
Datum obhajoby: | 2. 6. 2021 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/74962/podrobnosti |