Datamining a využití rozhodovacích stromů při tvorbě Scorecards

Název práce: Datamining a využití rozhodovacích stromů při tvorbě Scorecards
Autor(ka) práce: Straková, Kristýna
Typ práce: Diplomová práce
Vedoucí práce: Witzany, Jiří
Oponenti práce: Fičura, Milan
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá porovnáním několika vybraných modelovacích metod, které používají finanční instituce (a nejen ty) ve svých rozhodovacích procesech. Ve své první části se teoreticky zabývá nejznámějšími modelovacími metodami, jako je logistická regrese, rozhodovací stromy, neuronové sítě, alternující rozhodovací stromy a poměrně novou metodou nazvanou "Random forest", kterou můžeme doslovně přeložit jako náhodný les. V praktické části této diplomové práce jsou nejprve nastíněny některé procesy uvnitř finančních institucí, ve kterých jsou dané modelovací metody využívány. Na reálných datech dvou finančních institucí jsou mezi sebou srovnávány metody logistické regrese, rozhodovacích stromů a rozhodovacího lesa. Metoda neuronové sítě do porovnání zahrnuta není. Důvodem je především velmi náročná interpretovatelnost výsledků této metody. V závěru se pak práce na základě výsledných modelů snaží odpovědět na otázku, zda je doposud nejpoužívanější metoda logistické regrese tou nejvhodnější.
Klíčová slova: logistická regrese; Rozhodovací stromy; predelikventní skóringový model; aplikační skóringový model; náhodný les
Název práce: Data Mining and use of decision trees by creation of Scorecards
Autor(ka) práce: Straková, Kristýna
Typ práce: Diploma thesis
Vedoucí práce: Witzany, Jiří
Oponenti práce: Fičura, Milan
Jazyk práce: Česky
Abstrakt:
The thesis presents a comparison of several selected modeling methods used by financial institutions for (not exclusively) decision-making processes. First theoretical part describes well known modeling methods such as logistic regression, decision trees, neural networks, alternating decision trees and relatively new method called "Random forest". The practical part of thesis outlines some processes within financial institutions, in which selected modeling methods are used. On real data of two financial institutions logistic regression, decision trees and decision forest are compared which each other. Method of neural network is not included due to its complex interpretability. In conclusion, based on resulting models, thesis is trying to answers, whether logistic regression (method most widely used by financial institutions) remains most suitable.
Klíčová slova: Decision trees; Pre-delinquent scoring model; random forest; application scoring model; logistic regression

Informace o studiu

Studijní program / obor: Finance a účetnictví/Finanční inženýrství
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta financí a účetnictví
Katedra: Katedra bankovnictví a pojišťovnictví

Informace o odevzdání a obhajobě

Datum zadání práce: 14. 2. 2014
Datum podání práce: 31. 5. 2014
Datum obhajoby: 4. 2. 2016
Identifikátor v systému InSIS: https://insis.vse.cz/zp/46422/podrobnosti

Soubory ke stažení

    Poslední aktualizace: