Vylepšení Logistické regrese pro vývoj Kreditních skórů

Název práce: Logistic regression improvements for credit scoring development
Autor(ka) práce: Pravdin, Nikolai
Typ práce: Diploma thesis
Vedoucí práce: Witzany, Jiří
Oponenti práce: Panoš, Jiří
Jazyk práce: English
Abstrakt:
The current Study investigates the impact of non-linear relationships between input variables during credit risk modeling. Particularly, it is meant to analyze the burden of variables’ non-linear behavior on the current modeling benchmark – Logistic regression – using some general set of retail clients’ data. The main focus done on application of alternative solutions to efficiently mitigate nonlinearity’s influence. Among them is well-known strong learner - Random Forest, as well as relatively new approach – Penalized Logit Tree Regression – a transparent and intuitive combination of Logit and Decision Trees. Mentioned methods are modeled on both the real-world data and specific simulated data with step-by-step description of the process. Finally, results are analytically compared using popular performance metrics like Gini Index and K-S statistic.
Klíčová slova: Probability of Default; Scoring models; Logistic regression; Random Forest; Penalized Logit Tree Regression; Credit risk; predictive power
Název práce: Vylepšení Logistické regrese pro vývoj Kreditních skórů
Autor(ka) práce: Pravdin, Nikolai
Typ práce: Diplomová práce
Vedoucí práce: Witzany, Jiří
Oponenti práce: Panoš, Jiří
Jazyk práce: English
Abstrakt:
Táto práce zkoumá dopad nelineárních vztahů mezi vstupními proměnnými při modelování kreditního rizika. Především je zaměřená na analýzu zatížení, které nelineárně chovající proměnné můžou způsobovat při používání skutečného benchmarku – Logistické regrese – v případě že pracujeme s obecnými údaji fyzických klientů. Hlavním záměrem je zkusit alternativní řešení, které by efektivně zmírnily negativní dopad případně nelinearity. Mezi nimi je dobře známý Náhodní Les, a taky poměrně nový přistup – Penalizována Logit Tree regrese – transparentní a intuitivní kombinace Logitu a Rozhodovacích stromů. Zvolené metody jsou aplikovány a jak na reálná data, tak i na simulovaný soubor, včetně detailního popisu celého procesu. Výsledkem je analytické porovnání výsledků při použití oblíbených ukazatelů výkonnosti jako Giního index a K-S statistika.
Klíčová slova: Kreditní riziko; Pravděpodobnost Defaultu; Logistická regrese; Skóringové modely; Náhodní les; Penalizována Logit Tree regrese; síla předpovědi

Informace o studiu

Studijní program / obor: Finanční inženýrství
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta financí a účetnictví
Katedra: Katedra bankovnictví a pojišťovnictví

Informace o odevzdání a obhajobě

Datum zadání práce: 30. 11. 2021
Datum podání práce: 19. 5. 2022
Datum obhajoby: 9. 6. 2022
Identifikátor v systému InSIS: https://insis.vse.cz/zp/78920/podrobnosti

Soubory ke stažení

    Poslední aktualizace: