Vylepšení Logistické regrese pro vývoj Kreditních skórů
Název práce: | Logistic regression improvements for credit scoring development |
---|---|
Autor(ka) práce: | Pravdin, Nikolai |
Typ práce: | Diploma thesis |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Panoš, Jiří |
Jazyk práce: | English |
Abstrakt: | The current Study investigates the impact of non-linear relationships between input variables during credit risk modeling. Particularly, it is meant to analyze the burden of variables’ non-linear behavior on the current modeling benchmark – Logistic regression – using some general set of retail clients’ data. The main focus done on application of alternative solutions to efficiently mitigate nonlinearity’s influence. Among them is well-known strong learner - Random Forest, as well as relatively new approach – Penalized Logit Tree Regression – a transparent and intuitive combination of Logit and Decision Trees. Mentioned methods are modeled on both the real-world data and specific simulated data with step-by-step description of the process. Finally, results are analytically compared using popular performance metrics like Gini Index and K-S statistic. |
Klíčová slova: | Probability of Default; Scoring models; Logistic regression; Random Forest; Penalized Logit Tree Regression; Credit risk; predictive power |
Název práce: | Vylepšení Logistické regrese pro vývoj Kreditních skórů |
---|---|
Autor(ka) práce: | Pravdin, Nikolai |
Typ práce: | Diplomová práce |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Panoš, Jiří |
Jazyk práce: | English |
Abstrakt: | Táto práce zkoumá dopad nelineárních vztahů mezi vstupními proměnnými při modelování kreditního rizika. Především je zaměřená na analýzu zatížení, které nelineárně chovající proměnné můžou způsobovat při používání skutečného benchmarku – Logistické regrese – v případě že pracujeme s obecnými údaji fyzických klientů. Hlavním záměrem je zkusit alternativní řešení, které by efektivně zmírnily negativní dopad případně nelinearity. Mezi nimi je dobře známý Náhodní Les, a taky poměrně nový přistup – Penalizována Logit Tree regrese – transparentní a intuitivní kombinace Logitu a Rozhodovacích stromů. Zvolené metody jsou aplikovány a jak na reálná data, tak i na simulovaný soubor, včetně detailního popisu celého procesu. Výsledkem je analytické porovnání výsledků při použití oblíbených ukazatelů výkonnosti jako Giního index a K-S statistika. |
Klíčová slova: | Kreditní riziko; Pravděpodobnost Defaultu; Logistická regrese; Skóringové modely; Náhodní les; Penalizována Logit Tree regrese; síla předpovědi |
Informace o studiu
Studijní program / obor: | Finanční inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta financí a účetnictví |
Katedra: | Katedra bankovnictví a pojišťovnictví |
Informace o odevzdání a obhajobě
Datum zadání práce: | 30. 11. 2021 |
---|---|
Datum podání práce: | 19. 5. 2022 |
Datum obhajoby: | 9. 6. 2022 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/78920/podrobnosti |