Zobecněný lineární model s využitím neuronových sítí pro predikci počtu škodních událostí

Česky
English

Název práce:	Zobecněný lineární model s využitím neuronových sítí pro predikci počtu škodních událostí
Autor(ka) práce:	Vít, Ondřej
Typ práce:	Diplomová práce
Vedoucí práce:	Štěpánek, Lubomír
Oponenti práce:	Habarta, Filip
Jazyk práce:	Česky
Abstrakt:	Škodní frekvence je spolu s výší škody důležitou součástí odhadu rizika v oboru pojišťovnictví. Na vhodných datech si klademe za cíl porovnat tradiční statistické metody, zejména zobecněné lineární modely, a metody založené na strojovém učení, především na neuronových sítích, a to v kontextu predikce počtu pojistných událostí na povinném ručení. Oba zmíněné způsoby byly aplikovány na reálná data podobná českému trhu s povinným ručením, což umožňuje odhadnout predikční schopnosti obou metod celkově i v jednotlivých rizikových segmentech a porovnat jejich výhody. Zatímco tradiční přístupy nabízejí osvědčené modely s dobrou interpretovatelností, moderní techniky přinášejí pokročilé možnosti modelování komplexních vzorců v datech. Na kategorizovaných datech pro zobecněné lineární modely se dostatečně neprojevily výhody statistického učení, které naopak častěji chybovalo na méně zastoupených segmentech. Výhodou neuronových sítí je práce s kategoriálními proměnnými nabývajícími mnoha možných hodnot, které lze rychle shlukovat a vizualizovat pomocí vložených vrstev. Primárně lze vidět budoucnost predikcí rizika v pojišťovnictví zejména v užívání hybridních modelů, které snoubí důležitou interpretovatelnost a s ní spojenou expertní škálovatelnost zobecněných lineárních modelů s identifikací komplikovanějších závislostí, které lze vhodně odhalit využitím neuronových sítí.
Klíčová slova:	škodní frekvence; zobecněný lineární model; statistické učení; neuronová síť

Název práce:	Generalized Linear Model Using Neural Networks for Predicting the Number of Claim Events
Autor(ka) práce:	Vít, Ondřej
Typ práce:	Diploma thesis
Vedoucí práce:	Štěpánek, Lubomír
Oponenti práce:	Habarta, Filip
Jazyk práce:	Česky
Abstrakt:	The claim frequency, along with the extent of damage, is a crucial part of risk estimation in the insurance sector. Using appropriate data, our goal is to compare traditional statistical methods, particularly generalized linear models, with methods based on machine learning, especially neural networks, in the context of predicting the number of insurance events in mandatory liability insurance. Both mentioned approaches were applied to real data similar to the Czech mandatory insurance market, allowing us to estimate the predictive capabilities of both methods overall and in individual risk segments and to compare their advantages. While traditional approaches offer proven models with good interpretability, modern techniques provide advanced options for modeling complex patterns in the data. On categorized data for generalized linear models, the advantages of statistical learning, which more often made predictive errors in less represented segments, were not sufficiently demonstrated. An advantage of the neural networks is its ability to work with categorical variables that have many possible values, which can be quickly clustered and visualized using embedded layers. Primarily, the future of risk prediction in insurance is seen especially in the use of hybrid models that combine the important interpretability and associated expert scalability of generalized linear models with the identification of more complex dependencies that can be appropriately uncovered using neural networks.
Klíčová slova:	claims frequency; general linear model; machine learning; neural net

Informace o studiu

Studijní program / obor:	Statistika
Typ studijního programu:	Magisterský studijní program
Přidělovaná hodnost:	Ing.
Instituce přidělující hodnost:	Vysoká škola ekonomická v Praze
Fakulta:	Fakulta informatiky a statistiky
Katedra:	Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce:	12. 1. 2024
Datum podání práce:	27. 6. 2024
Datum obhajoby:	19. 8. 2024
Identifikátor v systému InSIS:	https://insis.vse.cz/zp/87087/podrobnosti

Soubory ke stažení

Hlavní práce
87087_vito02.pdf, 2.4 MB Stáhnout

Oponentura
84058_xhabf00.pdf, 111.6 kB Stáhnout

Hodnocení vedoucího
87087_stel04.pdf, 140.3 kB Stáhnout