Zobecněný lineární model s využitím neuronových sítí pro predikci počtu škodních událostí
Název práce: | Zobecněný lineární model s využitím neuronových sítí pro predikci počtu škodních událostí |
---|---|
Autor(ka) práce: | Vít, Ondřej |
Typ práce: | Diplomová práce |
Vedoucí práce: | Štěpánek, Lubomír |
Oponenti práce: | Habarta, Filip |
Jazyk práce: | Česky |
Abstrakt: | Škodní frekvence je spolu s výší škody důležitou součástí odhadu rizika v oboru pojišťovnictví. Na vhodných datech si klademe za cíl porovnat tradiční statistické metody, zejména zobecněné lineární modely, a metody založené na strojovém učení, především na neuronových sítích, a to v kontextu predikce počtu pojistných událostí na povinném ručení. Oba zmíněné způsoby byly aplikovány na reálná data podobná českému trhu s povinným ručením, což umožňuje odhadnout predikční schopnosti obou metod celkově i v jednotlivých rizikových segmentech a porovnat jejich výhody. Zatímco tradiční přístupy nabízejí osvědčené modely s dobrou interpretovatelností, moderní techniky přinášejí pokročilé možnosti modelování komplexních vzorců v datech. Na kategorizovaných datech pro zobecněné lineární modely se dostatečně neprojevily výhody statistického učení, které naopak častěji chybovalo na méně zastoupených segmentech. Výhodou neuronových sítí je práce s kategoriálními proměnnými nabývajícími mnoha možných hodnot, které lze rychle shlukovat a vizualizovat pomocí vložených vrstev. Primárně lze vidět budoucnost predikcí rizika v pojišťovnictví zejména v užívání hybridních modelů, které snoubí důležitou interpretovatelnost a s ní spojenou expertní škálovatelnost zobecněných lineárních modelů s identifikací komplikovanějších závislostí, které lze vhodně odhalit využitím neuronových sítí. |
Klíčová slova: | škodní frekvence; zobecněný lineární model; statistické učení; neuronová síť |
Název práce: | Generalized Linear Model Using Neural Networks for Predicting the Number of Claim Events |
---|---|
Autor(ka) práce: | Vít, Ondřej |
Typ práce: | Diploma thesis |
Vedoucí práce: | Štěpánek, Lubomír |
Oponenti práce: | Habarta, Filip |
Jazyk práce: | Česky |
Abstrakt: | The claim frequency, along with the extent of damage, is a crucial part of risk estimation in the insurance sector. Using appropriate data, our goal is to compare traditional statistical methods, particularly generalized linear models, with methods based on machine learning, especially neural networks, in the context of predicting the number of insurance events in mandatory liability insurance. Both mentioned approaches were applied to real data similar to the Czech mandatory insurance market, allowing us to estimate the predictive capabilities of both methods overall and in individual risk segments and to compare their advantages. While traditional approaches offer proven models with good interpretability, modern techniques provide advanced options for modeling complex patterns in the data. On categorized data for generalized linear models, the advantages of statistical learning, which more often made predictive errors in less represented segments, were not sufficiently demonstrated. An advantage of the neural networks is its ability to work with categorical variables that have many possible values, which can be quickly clustered and visualized using embedded layers. Primarily, the future of risk prediction in insurance is seen especially in the use of hybrid models that combine the important interpretability and associated expert scalability of generalized linear models with the identification of more complex dependencies that can be appropriately uncovered using neural networks. |
Klíčová slova: | claims frequency; general linear model; machine learning; neural net |
Informace o studiu
Studijní program / obor: | Statistika |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 12. 1. 2024 |
---|---|
Datum podání práce: | 27. 6. 2024 |
Datum obhajoby: | 19. 8. 2024 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/87087/podrobnosti |