Rozhodovací stromy pro modelování rizika nesplacení
Název práce: | Rozhodovací stromy pro modelování rizika nesplacení |
---|---|
Autor(ka) práce: | Dušek, Ondřej |
Typ práce: | Diplomová práce |
Vedoucí práce: | Čabla, Adam |
Oponenti práce: | Koudelka, Jiří |
Jazyk práce: | Česky |
Abstrakt: | Diplomová práce je zaměřena na představení vybraných metod pro analýzu klientských úvěrů. Důraz je kladen především na binární klasifikační a regresní metody založené na rozhodovacích stromech. Metody doprovází úprava, příprava a balancování dat doplněné exploratorní analýzou. Metody jsou použity na reálném datovém souboru obsahujícím informace o jednotlivých úvěrech a žádostí o úvěry vybrané společnosti společně s externími zdroji informací. Metodami klasifikačních a regresních stromů, bagging, random forest a boosting je predikována schopnost klienta splácet své úvěry. Uvedené metody byly zpracovány za pomoci softwaru R a RStudio a jednotlivých balíčků. Práce si klade za cíl seznámit čtenáře s aplikováním jednotlivých metod na reálné úloze. Z použitých metod se nejvíce osvědčila metoda boosting a balancování dat pomocí metody undersampling. |
Klíčová slova: | bagging; binární klasifikace; boosting; predikční modely; random forest; rizikovost úvěrů; rozhodovací stromy |
Název práce: | Decision trees and modeling of credit risk |
---|---|
Autor(ka) práce: | Dušek, Ondřej |
Typ práce: | Diploma thesis |
Vedoucí práce: | Čabla, Adam |
Oponenti práce: | Koudelka, Jiří |
Jazyk práce: | Česky |
Abstrakt: | The diploma thesis is focused on the introduction of selected methods for the analysis of client loans. Emphasis is placed primarily on binary classification and regression methods based on decision trees. The methods are accompanied by data editing, preparation and balancing supplemented by exploratory analysis. The methods are used on a real data file containing information of individual loans and loan applications of the selected company together with external sources of information. The methods of classification and regression trees, bagging, random forest and boosting predict the client's ability to repay his loans. These methods were developed using R and RStudio software and individual packages. The work aims to acquaint the reader with the application of individual methods on a real task. Of the methods used, the method of boosting and balancing data using the undersampling method proved to be the most effective. |
Klíčová slova: | boosting; predictive models; random forest; bagging; binary classification; credit risk; decision trees |
Informace o studiu
Studijní program / obor: | Kvantitativní metody v ekonomice/Statistika |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 21. 10. 2019 |
---|---|
Datum podání práce: | 25. 6. 2020 |
Datum obhajoby: | 24. 8. 2020 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/71370/podrobnosti |