Comparison of machine learning methods for credit risk analysis

Thesis title: Porovnanie metód machine learningu pre analýzu kreditného rizika
Author: Bušo, Bohumír
Thesis type: Diploma thesis
Supervisor: Kolman, Marek
Opponents: Vacek, Vladislav
Thesis language: Slovensky
Abstract:
Strojové učenie je v poslednej dobe čoraz častejšie spomínané spolu s oblasťou "Big Data". Jedná sa o oblasť, kde je k dispozícii veľké množstvo dát, z ktorých je potrebné získať užitočné informácie. Keďže v tejto dobe generujeme čoraz viac a viac dát, či už pomocou mobilných zariadení platobných kariet a pod., je otázka spracovania vysoko aktuálna. V tejto práci je opísaných šesť rôznych metód, ktoré slúžia na tento účel. Sú to logistická regresia, plytké a hlboké neurónové siete, bagging, boosting a stacking. Posledné tri spomínané patria do kategórie nazývanej skupinové učenie. Metódy sú ďalej aplikované na reálne dáta z prostredia úverových inštitúcií, kde môžu pomôcť ku klasifikácii potenciálnych klientov pri žiadosti o úver. V závere sú výsledky získané pre jednotlivé metódy porovnané a v krátkosti aj interpretované.
Keywords: strojové učenie; klasifikácia; Big Data
Thesis title: Porovnání metod machine learningu pro analýzu kreditního rizika
Author: Bušo, Bohumír
Thesis type: Diplomová práce
Supervisor: Kolman, Marek
Opponents: Vacek, Vladislav
Thesis language: Slovensky
Abstract:
Strojové učení je v poslední době stále častěji zmiňované spolu s oblastí,, Big Data ''. Jedná se o oblast, kde je k dispozici velké množství dat, z nichž je třeba získat užitečné informace. Jelikož v této době generujeme stále více a více dat, ať už pomocí mobilních zařízení platebních karet a pod., je otázka zpracování vysoce aktuální. V této práci je popsaných šest různých metod, které slouží k tomuto účelu. Jsou to logistická regrese, mělké a hluboké neuronové sítě, bagging, boosting a stacking. Poslední tři zmíněné patří do kategorie zvané skupinové učení. Metody jsou dále aplikovány na reálná data z prostředí úvěrových institucí, kde mohou pomoci ke klasifikaci potenciálních klientů při žádosti o úvěr. V závěru jsou výsledky získané pro jednotlivé metody porovnány a v krátkosti i interpretovány.
Keywords: Big Data; klasifikace; strojové učení
Thesis title: Comparison of machine learning methods for credit risk analysis
Author: Bušo, Bohumír
Thesis type: Diploma thesis
Supervisor: Kolman, Marek
Opponents: Vacek, Vladislav
Thesis language: Slovensky
Abstract:
Recently, machine learning has been put into connection with a field called ,,Big Data'' more and more. Usually, in this field, a lot of data is available and we need to gather useful information based on this data. Nowadays, when still more and more data is generated by use of mobile phones, credit cards, etc., a need for high-performance methods is serious. In this work, we describe six different methods that serve this purpose. These are logistic regression, neural networks and deep neural networks, bagging, boosting and stacking. Last three methods compose a group called Ensemble Learning. We apply all six methods on real data, which were generously provided by one of the loan providers. These methods can help them to distinguish between good and bad potential takers of loans, when the decision about the loan is being made. Lastly, the results of particular methods are compared and we also briefly outline possible ways of interpretation.
Keywords: Classification; Machine Learning; Big Data

Information about study

Study programme: Finance a účetnictví/Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 29. 9. 2015
Date of submission: 31. 8. 2016
Date of defense: 21. 6. 2016
Identifier in the InSIS system: https://insis.vse.cz/zp/54330/podrobnosti

Files for download

    Last update: