Výkonnost modelů kreditního rizika v P2P úvěrování
Název práce: | Performance of credit risk models in P2P lending |
---|---|
Autor(ka) práce: | Španko, Martin |
Typ práce: | Diploma thesis |
Vedoucí práce: | Teplý, Petr |
Oponenti práce: | Palán, Luděk |
Jazyk práce: | English |
Abstrakt: | This thesis analyses machine learning algorithms for predicting P2P loan defaults based on data from the Zonky platform from February 2016 to October 2021. It analyses logistic regression, discriminant analysis, classification and regression trees, random forest, Naive Bayes, K-Nearest Neighbors, AdaBoost, and XGBoost, using metrics such as confusion matrix, ROC/AUC, Gini coefficient, Kolmogorov-Smirnov statistic, and Brier Score for evaluation. The results show that XGBoost and AdaBoost are the most effective, with Elastic Net Logistic Regression in third place. This study fills a gap in the research on default probability on the Zonky dataset and highlights payment behaviour as a key factor for predicting credit risk when evaluating P2P loans. This research contributes to the existing literature on loan default probability prediction and provides insights for risk management in P2P lending. |
Klíčová slova: | AdaBoost; Credit Risk; Elastic Net Regression; Machine Learning; Peer-to-Peer Lending; Probability of Default; XGBoost; Zonky |
Název práce: | Výkonnost modelů kreditního rizika v P2P úvěrování |
---|---|
Autor(ka) práce: | Španko, Martin |
Typ práce: | Diplomová práce |
Vedoucí práce: | Teplý, Petr |
Oponenti práce: | Palán, Luděk |
Jazyk práce: | English |
Abstrakt: | Tato diplomová práce “Výkonnost modelů kreditního rizika v P2P úvěrování” se zabývá analýzou algoritmů strojového učení pro predikci defaultu P2P půjček na základě dat z platformy Zonky z období od února 2016 do října 2021. Analyzuje logistickou regresi, diskriminační analýzu, klasifikační a regresní stromy, random forest, Naive Bayes, K-Nearest Neighbours, AdaBoost a XGBoost, přičemž k vyhodnocení používá metriky, jako matice záměn, ROC/AUC, Giniho koeficient, Kolmogorov-Smirnovova statistika a Brier Score. Výsledky ukazují, že nejefektivnější jsou XGBoost a AdaBoost, na třetím místě je Elastic Net Logistic Regression. Tato studie vyplňuje mezeru ve výzkumu pravděpodobnosti defaultu na datasetu Zonky a zdůrazňuje platební chování jako klíčový faktor pro predikci úvěrového rizika při hodnocení P2P půjček. Tento výzkum přispívá k existující literatuře o predikci pravdepodobnosti defaultu úvěru a poskytuje poznatky pro řízení rizik v oblasti P2P půjček. |
Klíčová slova: | Strojové učení; Peer-to-Peer půjčky; AdaBoost; Úvěrové riziko; Elastic Net Regression; Pravděpodobnost defaultu; XGBoost; Zonky |
Informace o studiu
Studijní program / obor: | Bankovnictví a pojišťovnictví |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta financí a účetnictví |
Katedra: | Katedra bankovnictví a pojišťovnictví |
Informace o odevzdání a obhajobě
Datum zadání práce: | 1. 10. 2022 |
---|---|
Datum podání práce: | 10. 1. 2024 |
Datum obhajoby: | 1. 2. 2024 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/83217/podrobnosti |