Comparison of machine learning methods for credit risk analysis
Thesis title: | Porovnanie metód machine learningu pre analýzu kreditného rizika |
---|---|
Author: | Bušo, Bohumír |
Thesis type: | Diploma thesis |
Supervisor: | Kolman, Marek |
Opponents: | Vacek, Vladislav |
Thesis language: | Slovensky |
Abstract: | Strojové učenie je v poslednej dobe čoraz častejšie spomínané spolu s oblasťou "Big Data". Jedná sa o oblasť, kde je k dispozícii veľké množstvo dát, z ktorých je potrebné získať užitočné informácie. Keďže v tejto dobe generujeme čoraz viac a viac dát, či už pomocou mobilných zariadení platobných kariet a pod., je otázka spracovania vysoko aktuálna. V tejto práci je opísaných šesť rôznych metód, ktoré slúžia na tento účel. Sú to logistická regresia, plytké a hlboké neurónové siete, bagging, boosting a stacking. Posledné tri spomínané patria do kategórie nazývanej skupinové učenie. Metódy sú ďalej aplikované na reálne dáta z prostredia úverových inštitúcií, kde môžu pomôcť ku klasifikácii potenciálnych klientov pri žiadosti o úver. V závere sú výsledky získané pre jednotlivé metódy porovnané a v krátkosti aj interpretované. |
Keywords: | strojové učenie; klasifikácia; Big Data |
Thesis title: | Porovnání metod machine learningu pro analýzu kreditního rizika |
---|---|
Author: | Bušo, Bohumír |
Thesis type: | Diplomová práce |
Supervisor: | Kolman, Marek |
Opponents: | Vacek, Vladislav |
Thesis language: | Slovensky |
Abstract: | Strojové učení je v poslední době stále častěji zmiňované spolu s oblastí,, Big Data ''. Jedná se o oblast, kde je k dispozici velké množství dat, z nichž je třeba získat užitečné informace. Jelikož v této době generujeme stále více a více dat, ať už pomocí mobilních zařízení platebních karet a pod., je otázka zpracování vysoce aktuální. V této práci je popsaných šest různých metod, které slouží k tomuto účelu. Jsou to logistická regrese, mělké a hluboké neuronové sítě, bagging, boosting a stacking. Poslední tři zmíněné patří do kategorie zvané skupinové učení. Metody jsou dále aplikovány na reálná data z prostředí úvěrových institucí, kde mohou pomoci ke klasifikaci potenciálních klientů při žádosti o úvěr. V závěru jsou výsledky získané pro jednotlivé metody porovnány a v krátkosti i interpretovány. |
Keywords: | Big Data; klasifikace; strojové učení |
Thesis title: | Comparison of machine learning methods for credit risk analysis |
---|---|
Author: | Bušo, Bohumír |
Thesis type: | Diploma thesis |
Supervisor: | Kolman, Marek |
Opponents: | Vacek, Vladislav |
Thesis language: | Slovensky |
Abstract: | Recently, machine learning has been put into connection with a field called ,,Big Data'' more and more. Usually, in this field, a lot of data is available and we need to gather useful information based on this data. Nowadays, when still more and more data is generated by use of mobile phones, credit cards, etc., a need for high-performance methods is serious. In this work, we describe six different methods that serve this purpose. These are logistic regression, neural networks and deep neural networks, bagging, boosting and stacking. Last three methods compose a group called Ensemble Learning. We apply all six methods on real data, which were generously provided by one of the loan providers. These methods can help them to distinguish between good and bad potential takers of loans, when the decision about the loan is being made. Lastly, the results of particular methods are compared and we also briefly outline possible ways of interpretation. |
Keywords: | Classification; Machine Learning; Big Data |
Information about study
Study programme: | Finance a účetnictví/Finanční inženýrství |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Finance and Accounting |
Department: | Department of Banking and Insurance |
Information on submission and defense
Date of assignment: | 29. 9. 2015 |
---|---|
Date of submission: | 31. 8. 2016 |
Date of defense: | 21. 6. 2016 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/54330/podrobnosti |