Development and Evaluation of Scoring Models for the Banking Retail Sector

Thesis title: Vývoj a evaluace skóringových modelů pro bankovní retailový sektor
Author: Brachtlová, Gabriela
Thesis type: Diplomová práce
Supervisor: Witzany, Jiří
Opponents: Jouda, Jan
Thesis language: Česky
Abstract:
Tato práce se zabývá vývojem a evaluací skóringových modelů pro predikování rizika selhání klientů v rámci bankovního retailového sektoru. Zpracovaná data jsou získána z veřejně dostupné soutěže pořádané nebankovní finanční institucí Home Credit. V první až třetí kapitole je popsána daná problematika kreditního rizika a vývoje skóringových modelů. Čtvrtá kapitola je věnována praktickému vyvinutí pěti modelů pomocí klasického statistického přístupu reprezentovaného logistickou regresí, strojového učení (Random Forest, LightGBM, MLP) a hybridního modelu. Na základě hodnocení modelů výkonnostními metrikami dosáhl nejlepšího výsledku hybridní model spojující gradient boostingové algoritmy a logistickou regresi. Výstupy vývoje modelů jsou okomentovány a shrnuty v závěru práce.
Keywords: LightGBM; validace; logistická regrese; rozhodovací stromy; rating; gradient boosting algoritmy; Random Forest; kreditní riziko; řízení kreditního rizika; skóringový model; kalibrace; skóring; strojové učení; neuronové sítě
Thesis title: Development and Evaluation of Scoring Models for the Banking Retail Sector
Author: Brachtlová, Gabriela
Thesis type: Diploma thesis
Supervisor: Witzany, Jiří
Opponents: Jouda, Jan
Thesis language: Česky
Abstract:
This thesis is focused on the development and evaluation of scoring models for predicting the risk of client default in the banking retail sector. The processed data were obtained from a publicly available competition organized by the non-bank financial institution Home Credit. Chapters 1 to 3 describe the issue of credit risk and the development of scoring models. Chapter 4 is devoted to the practical development of five models using a classical statistical approach represented by logistic regression, machine learning methods (Random Forest, LightGBM, MLP), and a hybrid model. Based on the evaluation of model performance metrics, the best result was achieved by the hybrid model combining gradient boosting algorithms and logistic regression. The outcomes of the model development are discussed and summarized in the conclusion of the thesis.
Keywords: rating; validation; calibration; credit risk management; scoring model; neural networks; machine learning; credit risk; scoring; Random Forest; gradient boosting algorithms; logistic regression; decision trees; LightGBM

Information about study

Study programme: Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 21. 11. 2024
Date of submission: 30. 5. 2025
Date of defense: 24. 6. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/90457/podrobnosti

Files for download

    Last update: