Predicting Prepayment risk of unsecured consumer loans

Thesis title: Predikce rizika předsplácení nezajištěných úvěrů
Author: Tran, Tung Thanh
Thesis type: Diplomová práce
Supervisor: Fičura, Milan
Opponents: Drahokoupil, Matěj
Thesis language: Česky
Abstract:
Riziko předčasného splácení je pro finanční instituce, které nabízejí úvěrové produkty, velmi důležitým aspektem v oblasti řízení rizik. Za normálních tržních podmínek může mít pro banky dokonce větší finanční následky než ztráty z defaultů úvěrů, které se bankám daří řídit poměrně spolehlivě. Přesto riziku předčasného splácení nebylo věnováno tolik prostoru zejména v predikování na individuální úrovni. Cílem diplomové práce je porovnat vybrané modely pro predikci předčasného splacení za účelem snížení jeho míry a ztrát z toho vyplývajících. V práci je využit nevyvážený datový soubor, kdy zastoupení jednotlivých tříd není rovnoměrné a pro většinu klasických metod strojového učení je trénování modelu pro predikci minoritní třídy velice náročné. Tradiční modely v případech nevyvážené distribuce tříd mnohdy dávají mylně optimistické výsledky. Vykazují vysokou přesnost predikování majoritní třídy, avšak nemají schopnost predikce minoritní třídy, která bývá mnohdy důležitější. Existuje několik přístupů k vybalancování dat. Pro účely této práce byla použita oblíbená metoda převzorkování dat SmoteTomek, která je kombinací oversamplingu a undersamplingu. Ukázalo se, že tato metoda má pozitivní vliv na zlepšení schopnosti modelu rozpoznávat minoritní třídu, zejména v případě logistické regrese. Porovnávanými klasifikátory byly logistická regrese, náhodné lesy a neuronová síť. Nejlepší výkonnost prokázaly neuronové sítě. Pro výzkum byla poskytnuta reálná bankovní data nezajištěných spotřebitelských půjček.
Keywords: klasifikace; nevyvážený datový soubor; strojové učení; logistická regrese; Předčasné splacení půjčky; náhodný les; neuronová síť
Thesis title: Predicting Prepayment risk of unsecured consumer loans
Author: Tran, Tung Thanh
Thesis type: Diploma thesis
Supervisor: Fičura, Milan
Opponents: Drahokoupil, Matěj
Thesis language: Česky
Abstract:
Prepayment risk is a very important aspect of risk management for financial institutions offering credit products. Under normal market conditions, it can have even greater financial consequences for banks than losses from loan defaults, which banks manage quite reliably. Nevertheless, the risk of prepayment has not been given as much attention, especially in individual-level forecasting. The aim of this thesis is to compare selected models for predicting loan prepayments in order to reduce its rate and the resulting losses. In this thesis, we encounter an unbalanced dataset where the representation of each class is not uniform and most classical machine learning methods find it very challenging to train in order to predict minority class. Traditional models often give falsely optimistic results in cases of imbalanced class distribution. They show high accuracy in predicting the majority class, but lack the ability to predict the minority class, which is often desired output. There are several approaches to balancing the data. For our purposes, the popular SmoteTomek data sampling method was used, which is a combination of oversampling and undersampling. This method has been shown to have a positive effect on improving the model's ability to recognize the minority class mainly in case of logistic regression. The classifiers compared were logistic regression, random forests and neural network. Neural network showed the best performance. Real data of unsecured consumer loans were provided for the research.
Keywords: logistic regression; random forest; Loan prepayment; classification problem; neural network; imbalanced data; machine learning

Information about study

Study programme: Finance a účetnictví/Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 10. 12. 2018
Date of submission: 16. 1. 2023
Date of defense: 2. 2. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/68013/podrobnosti

Files for download

    Last update: