Logistic regression improvements for credit scoring development
Thesis title: | Logistic regression improvements for credit scoring development |
---|---|
Author: | Pravdin, Nikolai |
Thesis type: | Diploma thesis |
Supervisor: | Witzany, Jiří |
Opponents: | Panoš, Jiří |
Thesis language: | English |
Abstract: | The current Study investigates the impact of non-linear relationships between input variables during credit risk modeling. Particularly, it is meant to analyze the burden of variables’ non-linear behavior on the current modeling benchmark – Logistic regression – using some general set of retail clients’ data. The main focus done on application of alternative solutions to efficiently mitigate nonlinearity’s influence. Among them is well-known strong learner - Random Forest, as well as relatively new approach – Penalized Logit Tree Regression – a transparent and intuitive combination of Logit and Decision Trees. Mentioned methods are modeled on both the real-world data and specific simulated data with step-by-step description of the process. Finally, results are analytically compared using popular performance metrics like Gini Index and K-S statistic. |
Keywords: | Probability of Default; Scoring models; Logistic regression; Random Forest; Penalized Logit Tree Regression; Credit risk; predictive power |
Thesis title: | Vylepšení Logistické regrese pro vývoj Kreditních skórů |
---|---|
Author: | Pravdin, Nikolai |
Thesis type: | Diplomová práce |
Supervisor: | Witzany, Jiří |
Opponents: | Panoš, Jiří |
Thesis language: | English |
Abstract: | Táto práce zkoumá dopad nelineárních vztahů mezi vstupními proměnnými při modelování kreditního rizika. Především je zaměřená na analýzu zatížení, které nelineárně chovající proměnné můžou způsobovat při používání skutečného benchmarku – Logistické regrese – v případě že pracujeme s obecnými údaji fyzických klientů. Hlavním záměrem je zkusit alternativní řešení, které by efektivně zmírnily negativní dopad případně nelinearity. Mezi nimi je dobře známý Náhodní Les, a taky poměrně nový přistup – Penalizována Logit Tree regrese – transparentní a intuitivní kombinace Logitu a Rozhodovacích stromů. Zvolené metody jsou aplikovány a jak na reálná data, tak i na simulovaný soubor, včetně detailního popisu celého procesu. Výsledkem je analytické porovnání výsledků při použití oblíbených ukazatelů výkonnosti jako Giního index a K-S statistika. |
Keywords: | Kreditní riziko; Pravděpodobnost Defaultu; Logistická regrese; Skóringové modely; Náhodní les; Penalizována Logit Tree regrese; síla předpovědi |
Information about study
Study programme: | Finanční inženýrství |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Finance and Accounting |
Department: | Department of Banking and Insurance |
Information on submission and defense
Date of assignment: | 30. 11. 2021 |
---|---|
Date of submission: | 19. 5. 2022 |
Date of defense: | 9. 6. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/78920/podrobnosti |