Rozhodovací stromy pro modelování rizika nesplacení

Název práce: Rozhodovací stromy pro modelování rizika nesplacení
Autor(ka) práce: Dušek, Ondřej
Typ práce: Diplomová práce
Vedoucí práce: Čabla, Adam
Oponenti práce: Koudelka, Jiří
Jazyk práce: Česky
Abstrakt:
Diplomová práce je zaměřena na představení vybraných metod pro analýzu klientských úvěrů. Důraz je kladen především na binární klasifikační a regresní metody založené na rozhodovacích stromech. Metody doprovází úprava, příprava a balancování dat doplněné exploratorní analýzou. Metody jsou použity na reálném datovém souboru obsahujícím informace o jednotlivých úvěrech a žádostí o úvěry vybrané společnosti společně s externími zdroji informací. Metodami klasifikačních a regresních stromů, bagging, random forest a boosting je predikována schopnost klienta splácet své úvěry. Uvedené metody byly zpracovány za pomoci softwaru R a RStudio a jednotlivých balíčků. Práce si klade za cíl seznámit čtenáře s aplikováním jednotlivých metod na reálné úloze. Z použitých metod se nejvíce osvědčila metoda boosting a balancování dat pomocí metody undersampling.
Klíčová slova: bagging; binární klasifikace; boosting; predikční modely; random forest; rizikovost úvěrů; rozhodovací stromy
Název práce: Decision trees and modeling of credit risk
Autor(ka) práce: Dušek, Ondřej
Typ práce: Diploma thesis
Vedoucí práce: Čabla, Adam
Oponenti práce: Koudelka, Jiří
Jazyk práce: Česky
Abstrakt:
The diploma thesis is focused on the introduction of selected methods for the analysis of client loans. Emphasis is placed primarily on binary classification and regression methods based on decision trees. The methods are accompanied by data editing, preparation and balancing supplemented by exploratory analysis. The methods are used on a real data file containing information of individual loans and loan applications of the selected company together with external sources of information. The methods of classification and regression trees, bagging, random forest and boosting predict the client's ability to repay his loans. These methods were developed using R and RStudio software and individual packages. The work aims to acquaint the reader with the application of individual methods on a real task. Of the methods used, the method of boosting and balancing data using the undersampling method proved to be the most effective.
Klíčová slova: boosting; predictive models; random forest; bagging; binary classification; credit risk; decision trees

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Statistika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 21. 10. 2019
Datum podání práce: 25. 6. 2020
Datum obhajoby: 24. 8. 2020
Identifikátor v systému InSIS: https://insis.vse.cz/zp/71370/podrobnosti

Soubory ke stažení

    Poslední aktualizace: