Komparativní analýza modelů pro predikci pravděpodobnosti defaultu
Autor(ka) práce:
Vujčić, Stevan
Typ práce:
Diploma thesis
Vedoucí práce:
Fičura, Milan
Oponenti práce:
Palán, Luděk
Jazyk práce:
English
Abstrakt:
A series of common machine learning models is estimated using behavioral home loans data of a major Czech banking institution. To address robustness, a variety of algorithms are used for modeling coupled with different approaches to data preprocessing and feature selection. Namely, several takes at feature transformations, class balancing, multicollinearity removal and feature selection are accounted for. It is found that in the case of the Czech home loans data the classical logistic regression approach is not outperformed by the more modern methods such as artificial neural networks or boosting.
Klíčová slova:
Machine Learning; Probability of Default; Credit Risk
Název práce:
Komparativní analýza modelů pro predikci pravděpodobnosti defaultu
Autor(ka) práce:
Vujčić, Stevan
Typ práce:
Diplomová práce
Vedoucí práce:
Fičura, Milan
Oponenti práce:
Palán, Luděk
Jazyk práce:
English
Abstrakt:
Série standardně používaných modelů strojového učení je odhadnuta na behaviorálních datech o úvěrech na bydlení a hypotéky významné české bankovní instituce. Za účelem ověření robustnosti výsledků jsou modely odhadnuty za různých přístupů k přeprocesování dat a selekce vysvětlujících proměnných. Uvažuje se několik kombinací transformací vysvětlujících proměnných, balancování poměru tříd závislé proměnné, odstranění multikolinearity a selekce vysvětlujících proměnných. Zjištěním je, že v případě portfolia úvěrů na bydlení a hypotéky není klasicky používaná logistická regrese nijak překonána modernějšími metodami, jako jsou neuronové sítě či boosting.