Mapping and optimization of the reminder process in an insurance company

Thesis title:	Zmapovanie a optimalizácia systému riadenia upomínania v poisťovni
Author:	Chládek, Jakub
Thesis type:	Diploma thesis
Supervisor:	Staněk, Štěpán
Opponents:	Zimmermann, Pavel
Thesis language:	Slovensky
Abstract:	Témou diplomovej práce je predikcia rizikových poistných zmlúv vzhľadom na dlžné poistné. V práci navrhnutý vlastný rámec strojového učenia je využívaný na tvorbu a následnú optimalizáciu klasifikačného modelu identifikujúceho potenciálne rizikové poistné zmluvy. Cieľom projektu je vytvoriť funkčný, kvalitný a implementovateľný model, prostredníctvom ktorého možno docieliť zefektívnenie procesu upomínania, a to vďaka jeho schopnosti detekcie zmlúv s vyšším rizikom neplnenia si svojich záväzkov voči firme. Tento nástroj poskytuje poisťovni možnosť prioritizácie zmlúv, zefektívnenia komunikácie voči klientom a včasnej intervencie, čo môže napomôcť k dosiahnutiu finančnej stability a zlepšeniu poskytovaných služieb. V práci je obzvlášť veľká pozornosť venovaná popisu a analýze použitých prediktívnych algoritmov. Použité modely pracujú na báze rôznych prístupov a rôznych predpokladov. Množina algoritmov obsahuje modely predpokladajúce lineárny vzťah medzi nezávislými premennými a cieľovou premennou, tiež modely zachytávajúce nelinearitu v dátach, až po modely založené na princípe rozhodovacích stromov. Pri výbere evaluačných metrík na hodnotenie prediktívnej schopnosti modelov je kladený najväčší dôraz na štatistiku pokrytia, F1 skóre a čas trénovania modelu. V optimalizačnej fáze modelovania sú využité techniky výberu premenných a ladenia hyperparametrov. Evaluáciou modelov je určený najvýkonnejší model, ktorým sa ukazuje byť model gradientného boostingu. Ten je otestovaný na množine nových dát s cieľom vyhodnotenia jeho skutočnej prediktívnej schopnosti v reálnom prostredí. Vyhodnotenie je doplnené o posúdenie interpretovateľnosti modelu.
Keywords:	platba poistného; upomínací proces; detekcia rizikových zmlúv; strojové učenie; poistenie; Python; klasifikácia; modelovanie; optimalizácia

Thesis title:	Zmapovanie a optimalizácia systému riadenia upomínania v poisťovni
Author:	Chládek, Jakub
Thesis type:	Diplomová práce
Supervisor:	Staněk, Štěpán
Opponents:	Zimmermann, Pavel
Thesis language:	Slovensky
Abstract:	Tématem práce je predikce rizikových pojistných smluv z hlediska dlužného pojistného. Vlastní rámec strojového učení navržený v práci je použit k vytvoření a následné optimalizaci klasifikačního modelu identifikujícího potenciálně rizikové pojistné smlouvy. Cílem projektu je vytvořit funkční, kvalitní a implementovatelný model, jehož prostřednictvím lze dosáhnout efektivnějšího procesu upomínání díky jeho schopnosti odhalit smlouvy s vyšším rizikem nesplácení závazků vůči pojišťovně. Tento nástroj poskytuje pojišťovně možnost prioritizace smluv, zefektivnění komunikace s klienty a včasné intervence, což může pomoci dosáhnout finanční stability a zlepšit poskytované služby. V této práci je zvláštní pozornost věnována popisu a analýze použitých prediktivních algoritmů. Použité modely pracují na základě různých přístupů a různých předpokladů. Soubor algoritmů zahrnuje modely předpokládající lineární vztah mezi nezávislými proměnnými a cílovou proměnnou, dále modely zachycující nelinearitu v datech, až po modely založené na principu rozhodovacích stromů. Při výběru hodnotících metrik pro posouzení predikční schopnosti modelů je největší důraz kladen na statistiku pokrytí, F1-skóre a dobu trénování modelu. Ve fázi optimalizace modelování se používají techniky výběru proměnných a ladění hyperparametrů. Vyhodnocením modelů se určí nejvýkonnější model, kterým je model gradientného boostingu. Ten je testován na novém souboru dat, aby se vyhodnotila jeho skutečná predikční schopnost v reálném prostředí. Vyhodnocení je doplněno posouzením interpretovatelnosti modelu.
Keywords:	pojištění; platba pojistného; upomínací proces; detekce rizikových smluv; strojové učení; Python; klasifikace; modelování; optimalizace

Thesis title:	Mapping and optimization of the reminder process in an insurance company
Author:	Chládek, Jakub
Thesis type:	Diploma thesis
Supervisor:	Staněk, Štěpán
Opponents:	Zimmermann, Pavel
Thesis language:	Slovensky
Abstract:	The topic of this master thesis is the prediction of potential risk insurance contracts with respect to their unpaid payments. A custom machine learning framework proposed in the thesis is used for building and optimization of a classification model identifying potentially risky insurance contracts. The aim of the project is to create a functional, high quality and implementable model through which a more efficient reminder process can be achieved, thanks to its ability to detect contracts with a higher risk of defaulting on their obligations to the company. This tool provides the possibility of prioritizing contracts, making communication to clients more effective and providing early intervention, which can help achieve financial stability and improve service delivery. In this thesis, particular attention is paid to the description and analysis of the used predictive algorithms. The used models work based on different approaches and using different assumptions. The set of algorithms includes models assuming a linear relationship between the independent variables and the target variable, also models capturing non-linearity in the data, up to models based on the principle of decision trees. In the selection of evaluation metrics to assess the predictive ability of the models, the greatest weight is placed on the statistics of recall, F1-score, and model fitting time. Variable selection and hyperparameter tuning techniques are used in the optimization phase of the modelling. By evaluating the models, the best performing model is determined, which turns out to be the gradient boosting model. This model is tested on a new dataset to evaluate its true predictive ability in a real-world setting. The model evaluation is complemented by an assessment of the interpretability of the model.
Keywords:	Insurance; insurance payment; reminder process; risk contract detection; machine learning; Python; classification; modelling; optimization

Information about study

Study programme:	Data a analytika pro business
Type of study programme:	Magisterský studijní program
Assigned degree:	Ing.
Institutions assigning academic degree:	Vysoká škola ekonomická v Praze
Faculty:	Faculty of Informatics and Statistics
Department:	Department of Information Technologies

Information on submission and defense

Date of assignment:	9. 2. 2024
Date of submission:	27. 6. 2024
Date of defense:	8. 10. 2024
Identifier in the InSIS system:	https://insis.vse.cz/zp/87416/podrobnosti

Files for download

Main text
87416_chlj07.pdf, 1.9 MB Download

Opponent's review
83961_zimmerp.pdf, 108.8 kB Download

Supervisor's review
87416_stas03.pdf, 105.2 kB Download