Use of Neural networks and Deep Learning for survival analysis in Credit Risk
Thesis title: | Use of Neural networks and Deep Learning for survival analysis in Credit Risk |
---|---|
Author: | Beneš, Martin |
Thesis type: | Diploma thesis |
Supervisor: | Drahokoupil, Jakub |
Opponents: | Jouda, Jan |
Thesis language: | English |
Abstract: | This thesis explores the application of survival analysis and machine learning techniques to credit risk modeling, focusing specifically on predicting the probability of default (PD) over a discrete-time horizon. A model based on the DeepHit architecture is developed for PD estimation and benchmarked against three other models: CoxTime, Random Survival Forest (RSF), and the standard Cox Proportional Hazards (CPH) model. The models are trained and evaluated on a real-world dataset of credit card clients from Taiwan, using survival analysis metrics such as the C-index and Integrated Brier Score (IBS). The results show that while DeepHit is capable of producing meaningful PD outputs, the RSF and CoxTime models outperform it in both discrimination and calibration. The models' mean survival predictions are further compared against empirical Kaplan–Meier estimates to assess the alignment. A series of hypotheses are formulated and statistically tested using bootstrapped confidence intervals. The study concludes that modern machine learning methods improve upon the baseline CPH model, but their practical deployment depends on interpretability and stability across real-world settings. |
Keywords: | DeepHit; Probabilty of Default; Survival Analysis; Neural Networks; Credit Risk Modeling; Deep Learning; Cox Proportional Hazards Model; Kaplan-Meier Estimate |
Thesis title: | Využití neuronových sítí a hlubokého učení pro analýzu přežití v kreditním riziku |
---|---|
Author: | Beneš, Martin |
Thesis type: | Diplomová práce |
Supervisor: | Drahokoupil, Jakub |
Opponents: | Jouda, Jan |
Thesis language: | English |
Abstract: | Tato diplomová práce se zabývá aplikací metod analýzy přežití a strojového učení v oblasti modelování úvěrového rizika, konkrétně predikcí pravděpodobnosti selhání (PD) v diskrétním časovém rámci. Pro odhad PD je navržen model založený na architektuře DeepHit, který je porovnán se třemi dalšími modely: CoxTime, Random Survival Forest (RSF) a standardním Coxovým modelem proporcionálních rizik (CPH). Modely jsou trénovány a vyhodnoceny na reálném datasetu uživatelů kreditních karet z Tchaj-wanu pomocí metrik jako je C-index a Integrated Brier Score (IBS). Výsledky ukazují, že ačkoliv DeepHit dokáže generovat smysluplné výstupy, modely RSF a CoxTime jej překonávají jak v diskriminační schopnosti, tak v kalibraci. Průměrné predikce přežití jednotlivých modelů jsou dále porovnány s empirickými odhady Kaplan–Meierovy křivky. V rámci práce je formulováno několik hypotéz, které jsou statisticky testovány pomocí bootstrapových intervalů spolehlivosti. Práce dospívá k závěru, že moderní metody strojového učení přinášejí zlepšení oproti základnímu modelu CPH, avšak jejich praktické nasazení závisí na interpretovatelnosti výstupů a stabilitě v reálných podmínkách. |
Keywords: | Coxův model proporcionálních rizik; DeepHit; Modelování úvěrového rizika; Kaplan–Meierův odhad; Neuronové sítě; Hluboké učení; Analýza přežití; Pravděpodobnost selhání |
Information about study
Study programme: | Finanční inženýrství |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Finance and Accounting |
Department: | Department of Banking and Insurance |
Information on submission and defense
Date of assignment: | 17. 10. 2023 |
---|---|
Date of submission: | 1. 6. 2025 |
Date of defense: | 24. 6. 2025 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/86061/podrobnosti |