Logistic regression improvements for credit scoring development

Thesis title: Logistic regression improvements for credit scoring development
Author: Pravdin, Nikolai
Thesis type: Diploma thesis
Supervisor: Witzany, Jiří
Opponents: Panoš, Jiří
Thesis language: English
Abstract:
The current Study investigates the impact of non-linear relationships between input variables during credit risk modeling. Particularly, it is meant to analyze the burden of variables’ non-linear behavior on the current modeling benchmark – Logistic regression – using some general set of retail clients’ data. The main focus done on application of alternative solutions to efficiently mitigate nonlinearity’s influence. Among them is well-known strong learner - Random Forest, as well as relatively new approach – Penalized Logit Tree Regression – a transparent and intuitive combination of Logit and Decision Trees. Mentioned methods are modeled on both the real-world data and specific simulated data with step-by-step description of the process. Finally, results are analytically compared using popular performance metrics like Gini Index and K-S statistic.
Keywords: Probability of Default; Scoring models; Logistic regression; Random Forest; Penalized Logit Tree Regression; Credit risk; predictive power
Thesis title: Vylepšení Logistické regrese pro vývoj Kreditních skórů
Author: Pravdin, Nikolai
Thesis type: Diplomová práce
Supervisor: Witzany, Jiří
Opponents: Panoš, Jiří
Thesis language: English
Abstract:
Táto práce zkoumá dopad nelineárních vztahů mezi vstupními proměnnými při modelování kreditního rizika. Především je zaměřená na analýzu zatížení, které nelineárně chovající proměnné můžou způsobovat při používání skutečného benchmarku – Logistické regrese – v případě že pracujeme s obecnými údaji fyzických klientů. Hlavním záměrem je zkusit alternativní řešení, které by efektivně zmírnily negativní dopad případně nelinearity. Mezi nimi je dobře známý Náhodní Les, a taky poměrně nový přistup – Penalizována Logit Tree regrese – transparentní a intuitivní kombinace Logitu a Rozhodovacích stromů. Zvolené metody jsou aplikovány a jak na reálná data, tak i na simulovaný soubor, včetně detailního popisu celého procesu. Výsledkem je analytické porovnání výsledků při použití oblíbených ukazatelů výkonnosti jako Giního index a K-S statistika.
Keywords: Kreditní riziko; Pravděpodobnost Defaultu; Logistická regrese; Skóringové modely; Náhodní les; Penalizována Logit Tree regrese; síla předpovědi

Information about study

Study programme: Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 30. 11. 2021
Date of submission: 19. 5. 2022
Date of defense: 9. 6. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/78920/podrobnosti

Files for download

    Last update: