Porovnání metod machine learningu pro analýzu kreditního rizika
Název práce: | Porovnanie metód machine learningu pre analýzu kreditného rizika |
---|---|
Autor(ka) práce: | Bušo, Bohumír |
Typ práce: | Diplomová práce |
Vedoucí práce: | Kolman, Marek |
Oponenti práce: | Vacek, Vladislav |
Jazyk práce: | Slovensky |
Abstrakt: | Strojové učenie je v poslednej dobe čoraz častejšie spomínané spolu s oblasťou "Big Data". Jedná sa o oblasť, kde je k dispozícii veľké množstvo dát, z ktorých je potrebné získať užitočné informácie. Keďže v tejto dobe generujeme čoraz viac a viac dát, či už pomocou mobilných zariadení platobných kariet a pod., je otázka spracovania vysoko aktuálna. V tejto práci je opísaných šesť rôznych metód, ktoré slúžia na tento účel. Sú to logistická regresia, plytké a hlboké neurónové siete, bagging, boosting a stacking. Posledné tri spomínané patria do kategórie nazývanej skupinové učenie. Metódy sú ďalej aplikované na reálne dáta z prostredia úverových inštitúcií, kde môžu pomôcť ku klasifikácii potenciálnych klientov pri žiadosti o úver. V závere sú výsledky získané pre jednotlivé metódy porovnané a v krátkosti aj interpretované. |
Klíčová slova: | strojové učenie; klasifikácia; Big Data |
Název práce: | Porovnání metod machine learningu pro analýzu kreditního rizika |
---|---|
Autor(ka) práce: | Bušo, Bohumír |
Typ práce: | Diplomová práce |
Vedoucí práce: | Kolman, Marek |
Oponenti práce: | Vacek, Vladislav |
Jazyk práce: | Slovensky |
Abstrakt: | Strojové učení je v poslední době stále častěji zmiňované spolu s oblastí,, Big Data ''. Jedná se o oblast, kde je k dispozici velké množství dat, z nichž je třeba získat užitečné informace. Jelikož v této době generujeme stále více a více dat, ať už pomocí mobilních zařízení platebních karet a pod., je otázka zpracování vysoce aktuální. V této práci je popsaných šest různých metod, které slouží k tomuto účelu. Jsou to logistická regrese, mělké a hluboké neuronové sítě, bagging, boosting a stacking. Poslední tři zmíněné patří do kategorie zvané skupinové učení. Metody jsou dále aplikovány na reálná data z prostředí úvěrových institucí, kde mohou pomoci ke klasifikaci potenciálních klientů při žádosti o úvěr. V závěru jsou výsledky získané pro jednotlivé metody porovnány a v krátkosti i interpretovány. |
Klíčová slova: | Big Data; klasifikace; strojové učení |
Název práce: | Comparison of machine learning methods for credit risk analysis |
---|---|
Autor(ka) práce: | Bušo, Bohumír |
Typ práce: | Diploma thesis |
Vedoucí práce: | Kolman, Marek |
Oponenti práce: | Vacek, Vladislav |
Jazyk práce: | Slovensky |
Abstrakt: | Recently, machine learning has been put into connection with a field called ,,Big Data'' more and more. Usually, in this field, a lot of data is available and we need to gather useful information based on this data. Nowadays, when still more and more data is generated by use of mobile phones, credit cards, etc., a need for high-performance methods is serious. In this work, we describe six different methods that serve this purpose. These are logistic regression, neural networks and deep neural networks, bagging, boosting and stacking. Last three methods compose a group called Ensemble Learning. We apply all six methods on real data, which were generously provided by one of the loan providers. These methods can help them to distinguish between good and bad potential takers of loans, when the decision about the loan is being made. Lastly, the results of particular methods are compared and we also briefly outline possible ways of interpretation. |
Klíčová slova: | Classification; Machine Learning; Big Data |
Informace o studiu
Studijní program / obor: | Finance a účetnictví/Finanční inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta financí a účetnictví |
Katedra: | Katedra bankovnictví a pojišťovnictví |
Informace o odevzdání a obhajobě
Datum zadání práce: | 29. 9. 2015 |
---|---|
Datum podání práce: | 31. 8. 2016 |
Datum obhajoby: | 21. 6. 2016 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/54330/podrobnosti |