Development and Evaluation of Scoring Models for the Banking Retail Sector
Thesis title: | Vývoj a evaluace skóringových modelů pro bankovní retailový sektor |
---|---|
Author: | Brachtlová, Gabriela |
Thesis type: | Diplomová práce |
Supervisor: | Witzany, Jiří |
Opponents: | Jouda, Jan |
Thesis language: | Česky |
Abstract: | Tato práce se zabývá vývojem a evaluací skóringových modelů pro predikování rizika selhání klientů v rámci bankovního retailového sektoru. Zpracovaná data jsou získána z veřejně dostupné soutěže pořádané nebankovní finanční institucí Home Credit. V první až třetí kapitole je popsána daná problematika kreditního rizika a vývoje skóringových modelů. Čtvrtá kapitola je věnována praktickému vyvinutí pěti modelů pomocí klasického statistického přístupu reprezentovaného logistickou regresí, strojového učení (Random Forest, LightGBM, MLP) a hybridního modelu. Na základě hodnocení modelů výkonnostními metrikami dosáhl nejlepšího výsledku hybridní model spojující gradient boostingové algoritmy a logistickou regresi. Výstupy vývoje modelů jsou okomentovány a shrnuty v závěru práce. |
Keywords: | LightGBM; validace; logistická regrese; rozhodovací stromy; rating; gradient boosting algoritmy; Random Forest; kreditní riziko; řízení kreditního rizika; skóringový model; kalibrace; skóring; strojové učení; neuronové sítě |
Thesis title: | Development and Evaluation of Scoring Models for the Banking Retail Sector |
---|---|
Author: | Brachtlová, Gabriela |
Thesis type: | Diploma thesis |
Supervisor: | Witzany, Jiří |
Opponents: | Jouda, Jan |
Thesis language: | Česky |
Abstract: | This thesis is focused on the development and evaluation of scoring models for predicting the risk of client default in the banking retail sector. The processed data were obtained from a publicly available competition organized by the non-bank financial institution Home Credit. Chapters 1 to 3 describe the issue of credit risk and the development of scoring models. Chapter 4 is devoted to the practical development of five models using a classical statistical approach represented by logistic regression, machine learning methods (Random Forest, LightGBM, MLP), and a hybrid model. Based on the evaluation of model performance metrics, the best result was achieved by the hybrid model combining gradient boosting algorithms and logistic regression. The outcomes of the model development are discussed and summarized in the conclusion of the thesis. |
Keywords: | rating; validation; calibration; credit risk management; scoring model; neural networks; machine learning; credit risk; scoring; Random Forest; gradient boosting algorithms; logistic regression; decision trees; LightGBM |
Information about study
Study programme: | Finanční inženýrství |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Finance and Accounting |
Department: | Department of Banking and Insurance |
Information on submission and defense
Date of assignment: | 21. 11. 2024 |
---|---|
Date of submission: | 30. 5. 2025 |
Date of defense: | 24. 6. 2025 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/90457/podrobnosti |