Datamining a využití rozhodovacích stromů při tvorbě Scorecards
Název práce: | Datamining a využití rozhodovacích stromů při tvorbě Scorecards |
---|---|
Autor(ka) práce: | Straková, Kristýna |
Typ práce: | Diplomová práce |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Fičura, Milan |
Jazyk práce: | Česky |
Abstrakt: | Tato diplomová práce se zabývá porovnáním několika vybraných modelovacích metod, které používají finanční instituce (a nejen ty) ve svých rozhodovacích procesech. Ve své první části se teoreticky zabývá nejznámějšími modelovacími metodami, jako je logistická regrese, rozhodovací stromy, neuronové sítě, alternující rozhodovací stromy a poměrně novou metodou nazvanou "Random forest", kterou můžeme doslovně přeložit jako náhodný les. V praktické části této diplomové práce jsou nejprve nastíněny některé procesy uvnitř finančních institucí, ve kterých jsou dané modelovací metody využívány. Na reálných datech dvou finančních institucí jsou mezi sebou srovnávány metody logistické regrese, rozhodovacích stromů a rozhodovacího lesa. Metoda neuronové sítě do porovnání zahrnuta není. Důvodem je především velmi náročná interpretovatelnost výsledků této metody. V závěru se pak práce na základě výsledných modelů snaží odpovědět na otázku, zda je doposud nejpoužívanější metoda logistické regrese tou nejvhodnější. |
Klíčová slova: | logistická regrese; Rozhodovací stromy; predelikventní skóringový model; aplikační skóringový model; náhodný les |
Název práce: | Data Mining and use of decision trees by creation of Scorecards |
---|---|
Autor(ka) práce: | Straková, Kristýna |
Typ práce: | Diploma thesis |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Fičura, Milan |
Jazyk práce: | Česky |
Abstrakt: | The thesis presents a comparison of several selected modeling methods used by financial institutions for (not exclusively) decision-making processes. First theoretical part describes well known modeling methods such as logistic regression, decision trees, neural networks, alternating decision trees and relatively new method called "Random forest". The practical part of thesis outlines some processes within financial institutions, in which selected modeling methods are used. On real data of two financial institutions logistic regression, decision trees and decision forest are compared which each other. Method of neural network is not included due to its complex interpretability. In conclusion, based on resulting models, thesis is trying to answers, whether logistic regression (method most widely used by financial institutions) remains most suitable. |
Klíčová slova: | Decision trees; Pre-delinquent scoring model; random forest; application scoring model; logistic regression |
Informace o studiu
Studijní program / obor: | Finance a účetnictví/Finanční inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta financí a účetnictví |
Katedra: | Katedra bankovnictví a pojišťovnictví |
Informace o odevzdání a obhajobě
Datum zadání práce: | 14. 2. 2014 |
---|---|
Datum podání práce: | 31. 5. 2014 |
Datum obhajoby: | 4. 2. 2016 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/46422/podrobnosti |