Predikce rizika předsplácení nezajištěných úvěrů

Název práce: Predikce rizika předsplácení nezajištěných úvěrů
Autor(ka) práce: Tran, Tung Thanh
Typ práce: Diplomová práce
Vedoucí práce: Fičura, Milan
Oponenti práce: Drahokoupil, Matěj
Jazyk práce: Česky
Abstrakt:
Riziko předčasného splácení je pro finanční instituce, které nabízejí úvěrové produkty, velmi důležitým aspektem v oblasti řízení rizik. Za normálních tržních podmínek může mít pro banky dokonce větší finanční následky než ztráty z defaultů úvěrů, které se bankám daří řídit poměrně spolehlivě. Přesto riziku předčasného splácení nebylo věnováno tolik prostoru zejména v predikování na individuální úrovni. Cílem diplomové práce je porovnat vybrané modely pro predikci předčasného splacení za účelem snížení jeho míry a ztrát z toho vyplývajících. V práci je využit nevyvážený datový soubor, kdy zastoupení jednotlivých tříd není rovnoměrné a pro většinu klasických metod strojového učení je trénování modelu pro predikci minoritní třídy velice náročné. Tradiční modely v případech nevyvážené distribuce tříd mnohdy dávají mylně optimistické výsledky. Vykazují vysokou přesnost predikování majoritní třídy, avšak nemají schopnost predikce minoritní třídy, která bývá mnohdy důležitější. Existuje několik přístupů k vybalancování dat. Pro účely této práce byla použita oblíbená metoda převzorkování dat SmoteTomek, která je kombinací oversamplingu a undersamplingu. Ukázalo se, že tato metoda má pozitivní vliv na zlepšení schopnosti modelu rozpoznávat minoritní třídu, zejména v případě logistické regrese. Porovnávanými klasifikátory byly logistická regrese, náhodné lesy a neuronová síť. Nejlepší výkonnost prokázaly neuronové sítě. Pro výzkum byla poskytnuta reálná bankovní data nezajištěných spotřebitelských půjček.
Klíčová slova: klasifikace; nevyvážený datový soubor; strojové učení; logistická regrese; Předčasné splacení půjčky; náhodný les; neuronová síť
Název práce: Predicting Prepayment risk of unsecured consumer loans
Autor(ka) práce: Tran, Tung Thanh
Typ práce: Diploma thesis
Vedoucí práce: Fičura, Milan
Oponenti práce: Drahokoupil, Matěj
Jazyk práce: Česky
Abstrakt:
Prepayment risk is a very important aspect of risk management for financial institutions offering credit products. Under normal market conditions, it can have even greater financial consequences for banks than losses from loan defaults, which banks manage quite reliably. Nevertheless, the risk of prepayment has not been given as much attention, especially in individual-level forecasting. The aim of this thesis is to compare selected models for predicting loan prepayments in order to reduce its rate and the resulting losses. In this thesis, we encounter an unbalanced dataset where the representation of each class is not uniform and most classical machine learning methods find it very challenging to train in order to predict minority class. Traditional models often give falsely optimistic results in cases of imbalanced class distribution. They show high accuracy in predicting the majority class, but lack the ability to predict the minority class, which is often desired output. There are several approaches to balancing the data. For our purposes, the popular SmoteTomek data sampling method was used, which is a combination of oversampling and undersampling. This method has been shown to have a positive effect on improving the model's ability to recognize the minority class mainly in case of logistic regression. The classifiers compared were logistic regression, random forests and neural network. Neural network showed the best performance. Real data of unsecured consumer loans were provided for the research.
Klíčová slova: logistic regression; random forest; Loan prepayment; classification problem; neural network; imbalanced data; machine learning

Informace o studiu

Studijní program / obor: Finance a účetnictví/Finanční inženýrství
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta financí a účetnictví
Katedra: Katedra bankovnictví a pojišťovnictví

Informace o odevzdání a obhajobě

Datum zadání práce: 10. 12. 2018
Datum podání práce: 16. 1. 2023
Datum obhajoby: 2. 2. 2023
Identifikátor v systému InSIS: https://insis.vse.cz/zp/68013/podrobnosti

Soubory ke stažení

    Poslední aktualizace: