Metody modelování pravděpodobnosti defaultu firemních zákazníků banky
Název práce: | Metody modelování pravděpodobnosti defaultu firemních zákazníků banky |
---|---|
Autor(ka) práce: | Oleynik, Mariya |
Typ práce: | Diplomová práce |
Vedoucí práce: | Formánek, Tomáš |
Oponenti práce: | Holý, Vladimír |
Jazyk práce: | Česky |
Abstrakt: | Cílem diplomové práce je predikce pravděpodobnosti defaultu pomocí čtyř modelů a porovnání predikční schopnosti modelů. Použité modely pro predikci binární závislé proměnné jsou logistická regrese, zobecněný aditivní model, metoda podpůrných vektorů a rozhodovací strom. Aplikace modelů probíhá na reálných datech firemních klientů jedné české banky. K porovnání modelů se používají ROC, AUC a matice záměn. Nejlepším modelem na základě AUC se jeví metoda podpůrných vektorů, i když model vykazuje nejnižší hodnotu celkové správnosti v porovnání s ostatními modely. Zobecněný aditivní model má druhou největší hodnotu AUC a hodnotu celkové správnosti, jež jsou jenom o pár bodů vyšší než hodnoty odpovídající logistické regresi. Nejnižší AUC vychází u rozhodovacího stromu, který má zato nejvyšší hodnotu celkové správnosti, jelikož model správně zařadil největší počet klientů do jednotlivých tříd. |
Klíčová slova: | Pravděpodobnost defaultu; logistická regrese; zobecněný aditivní model; metoda podpůrných vektorů; rozhodovací strom |
Název práce: | Methods for modeling the probability of default of the bank's corporate clients |
---|---|
Autor(ka) práce: | Oleynik, Mariya |
Typ práce: | Diploma thesis |
Vedoucí práce: | Formánek, Tomáš |
Oponenti práce: | Holý, Vladimír |
Jazyk práce: | Česky |
Abstrakt: | The aim of the thesis is the prediction of the probability of default using four models and comparison of predictive accuracy of models. The models used for the prediction of binary dependent variable are logistic regression, generalized additive model, support vector machine and decision tree. The models are applied on real data of corporate clients of a Czech bank. ROC, AUC and confusion matrix are used to compare models. The support vector machine seems to be the best model based on AUC, although the model shows the lowest value of overall accuracy compared to other models. The generalized additive model has the second largest value of AUC and the value of overall accuracy, which are only a few points higher than the corresponding values of logistic regression. Decision tree has the lowest AUC, but also the model has the highest value of overall accuracy, because the model correctly classified the largest number of clients into classes. |
Klíčová slova: | Probability of default; logistic regression; generalized additive model; support vector machine; decision tree |
Informace o studiu
Studijní program / obor: | Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra ekonometrie |
Informace o odevzdání a obhajobě
Datum zadání práce: | 21. 6. 2019 |
---|---|
Datum podání práce: | 24. 6. 2020 |
Datum obhajoby: | 27. 8. 2020 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/70084/podrobnosti |