Porovnání metod machine learningu pro analýzu kreditního rizika

Název práce: Porovnanie metód machine learningu pre analýzu kreditného rizika
Autor(ka) práce: Bušo, Bohumír
Typ práce: Diplomová práce
Vedoucí práce: Kolman, Marek
Oponenti práce: Vacek, Vladislav
Jazyk práce: Slovensky
Abstrakt:
Strojové učenie je v poslednej dobe čoraz častejšie spomínané spolu s oblasťou "Big Data". Jedná sa o oblasť, kde je k dispozícii veľké množstvo dát, z ktorých je potrebné získať užitočné informácie. Keďže v tejto dobe generujeme čoraz viac a viac dát, či už pomocou mobilných zariadení platobných kariet a pod., je otázka spracovania vysoko aktuálna. V tejto práci je opísaných šesť rôznych metód, ktoré slúžia na tento účel. Sú to logistická regresia, plytké a hlboké neurónové siete, bagging, boosting a stacking. Posledné tri spomínané patria do kategórie nazývanej skupinové učenie. Metódy sú ďalej aplikované na reálne dáta z prostredia úverových inštitúcií, kde môžu pomôcť ku klasifikácii potenciálnych klientov pri žiadosti o úver. V závere sú výsledky získané pre jednotlivé metódy porovnané a v krátkosti aj interpretované.
Klíčová slova: strojové učenie; klasifikácia; Big Data
Název práce: Porovnání metod machine learningu pro analýzu kreditního rizika
Autor(ka) práce: Bušo, Bohumír
Typ práce: Diplomová práce
Vedoucí práce: Kolman, Marek
Oponenti práce: Vacek, Vladislav
Jazyk práce: Slovensky
Abstrakt:
Strojové učení je v poslední době stále častěji zmiňované spolu s oblastí,, Big Data ''. Jedná se o oblast, kde je k dispozici velké množství dat, z nichž je třeba získat užitečné informace. Jelikož v této době generujeme stále více a více dat, ať už pomocí mobilních zařízení platebních karet a pod., je otázka zpracování vysoce aktuální. V této práci je popsaných šest různých metod, které slouží k tomuto účelu. Jsou to logistická regrese, mělké a hluboké neuronové sítě, bagging, boosting a stacking. Poslední tři zmíněné patří do kategorie zvané skupinové učení. Metody jsou dále aplikovány na reálná data z prostředí úvěrových institucí, kde mohou pomoci ke klasifikaci potenciálních klientů při žádosti o úvěr. V závěru jsou výsledky získané pro jednotlivé metody porovnány a v krátkosti i interpretovány.
Klíčová slova: Big Data; klasifikace; strojové učení
Název práce: Comparison of machine learning methods for credit risk analysis
Autor(ka) práce: Bušo, Bohumír
Typ práce: Diploma thesis
Vedoucí práce: Kolman, Marek
Oponenti práce: Vacek, Vladislav
Jazyk práce: Slovensky
Abstrakt:
Recently, machine learning has been put into connection with a field called ,,Big Data'' more and more. Usually, in this field, a lot of data is available and we need to gather useful information based on this data. Nowadays, when still more and more data is generated by use of mobile phones, credit cards, etc., a need for high-performance methods is serious. In this work, we describe six different methods that serve this purpose. These are logistic regression, neural networks and deep neural networks, bagging, boosting and stacking. Last three methods compose a group called Ensemble Learning. We apply all six methods on real data, which were generously provided by one of the loan providers. These methods can help them to distinguish between good and bad potential takers of loans, when the decision about the loan is being made. Lastly, the results of particular methods are compared and we also briefly outline possible ways of interpretation.
Klíčová slova: Classification; Machine Learning; Big Data

Informace o studiu

Studijní program / obor: Finance a účetnictví/Finanční inženýrství
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta financí a účetnictví
Katedra: Katedra bankovnictví a pojišťovnictví

Informace o odevzdání a obhajobě

Datum zadání práce: 29. 9. 2015
Datum podání práce: 31. 8. 2016
Datum obhajoby: 21. 6. 2016
Identifikátor v systému InSIS: https://insis.vse.cz/zp/54330/podrobnosti

Soubory ke stažení

    Poslední aktualizace: