Use of Neural networks and Deep Learning for survival analysis in Credit Risk

Thesis title: Use of Neural networks and Deep Learning for survival analysis in Credit Risk
Author: Beneš, Martin
Thesis type: Diploma thesis
Supervisor: Drahokoupil, Jakub
Opponents: Jouda, Jan
Thesis language: English
Abstract:
This thesis explores the application of survival analysis and machine learning techniques to credit risk modeling, focusing specifically on predicting the probability of default (PD) over a discrete-time horizon. A model based on the DeepHit architecture is developed for PD estimation and benchmarked against three other models: CoxTime, Random Survival Forest (RSF), and the standard Cox Proportional Hazards (CPH) model. The models are trained and evaluated on a real-world dataset of credit card clients from Taiwan, using survival analysis metrics such as the C-index and Integrated Brier Score (IBS). The results show that while DeepHit is capable of producing meaningful PD outputs, the RSF and CoxTime models outperform it in both discrimination and calibration. The models' mean survival predictions are further compared against empirical Kaplan–Meier estimates to assess the alignment. A series of hypotheses are formulated and statistically tested using bootstrapped confidence intervals. The study concludes that modern machine learning methods improve upon the baseline CPH model, but their practical deployment depends on interpretability and stability across real-world settings.
Keywords: DeepHit; Probabilty of Default; Survival Analysis; Neural Networks; Credit Risk Modeling; Deep Learning; Cox Proportional Hazards Model; Kaplan-Meier Estimate
Thesis title: Využití neuronových sítí a hlubokého učení pro analýzu přežití v kreditním riziku
Author: Beneš, Martin
Thesis type: Diplomová práce
Supervisor: Drahokoupil, Jakub
Opponents: Jouda, Jan
Thesis language: English
Abstract:
Tato diplomová práce se zabývá aplikací metod analýzy přežití a strojového učení v oblasti modelování úvěrového rizika, konkrétně predikcí pravděpodobnosti selhání (PD) v diskrétním časovém rámci. Pro odhad PD je navržen model založený na architektuře DeepHit, který je porovnán se třemi dalšími modely: CoxTime, Random Survival Forest (RSF) a standardním Coxovým modelem proporcionálních rizik (CPH). Modely jsou trénovány a vyhodnoceny na reálném datasetu uživatelů kreditních karet z Tchaj-wanu pomocí metrik jako je C-index a Integrated Brier Score (IBS). Výsledky ukazují, že ačkoliv DeepHit dokáže generovat smysluplné výstupy, modely RSF a CoxTime jej překonávají jak v diskriminační schopnosti, tak v kalibraci. Průměrné predikce přežití jednotlivých modelů jsou dále porovnány s empirickými odhady Kaplan–Meierovy křivky. V rámci práce je formulováno několik hypotéz, které jsou statisticky testovány pomocí bootstrapových intervalů spolehlivosti. Práce dospívá k závěru, že moderní metody strojového učení přinášejí zlepšení oproti základnímu modelu CPH, avšak jejich praktické nasazení závisí na interpretovatelnosti výstupů a stabilitě v reálných podmínkách.
Keywords: Coxův model proporcionálních rizik; DeepHit; Modelování úvěrového rizika; Kaplan–Meierův odhad; Neuronové sítě; Hluboké učení; Analýza přežití; Pravděpodobnost selhání

Information about study

Study programme: Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 17. 10. 2023
Date of submission: 1. 6. 2025
Date of defense: 24. 6. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/86061/podrobnosti

Files for download

    Last update: