Data Mining and use of decision trees by creation of Scorecards
Thesis title: | Datamining a využití rozhodovacích stromů při tvorbě Scorecards |
---|---|
Author: | Straková, Kristýna |
Thesis type: | Diplomová práce |
Supervisor: | Witzany, Jiří |
Opponents: | Fičura, Milan |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá porovnáním několika vybraných modelovacích metod, které používají finanční instituce (a nejen ty) ve svých rozhodovacích procesech. Ve své první části se teoreticky zabývá nejznámějšími modelovacími metodami, jako je logistická regrese, rozhodovací stromy, neuronové sítě, alternující rozhodovací stromy a poměrně novou metodou nazvanou "Random forest", kterou můžeme doslovně přeložit jako náhodný les. V praktické části této diplomové práce jsou nejprve nastíněny některé procesy uvnitř finančních institucí, ve kterých jsou dané modelovací metody využívány. Na reálných datech dvou finančních institucí jsou mezi sebou srovnávány metody logistické regrese, rozhodovacích stromů a rozhodovacího lesa. Metoda neuronové sítě do porovnání zahrnuta není. Důvodem je především velmi náročná interpretovatelnost výsledků této metody. V závěru se pak práce na základě výsledných modelů snaží odpovědět na otázku, zda je doposud nejpoužívanější metoda logistické regrese tou nejvhodnější. |
Keywords: | logistická regrese; Rozhodovací stromy; predelikventní skóringový model; aplikační skóringový model; náhodný les |
Thesis title: | Data Mining and use of decision trees by creation of Scorecards |
---|---|
Author: | Straková, Kristýna |
Thesis type: | Diploma thesis |
Supervisor: | Witzany, Jiří |
Opponents: | Fičura, Milan |
Thesis language: | Česky |
Abstract: | The thesis presents a comparison of several selected modeling methods used by financial institutions for (not exclusively) decision-making processes. First theoretical part describes well known modeling methods such as logistic regression, decision trees, neural networks, alternating decision trees and relatively new method called "Random forest". The practical part of thesis outlines some processes within financial institutions, in which selected modeling methods are used. On real data of two financial institutions logistic regression, decision trees and decision forest are compared which each other. Method of neural network is not included due to its complex interpretability. In conclusion, based on resulting models, thesis is trying to answers, whether logistic regression (method most widely used by financial institutions) remains most suitable. |
Keywords: | Decision trees; Pre-delinquent scoring model; random forest; application scoring model; logistic regression |
Information about study
Study programme: | Finance a účetnictví/Finanční inženýrství |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Finance and Accounting |
Department: | Department of Banking and Insurance |
Information on submission and defense
Date of assignment: | 14. 2. 2014 |
---|---|
Date of submission: | 31. 5. 2014 |
Date of defense: | 4. 2. 2016 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/46422/podrobnosti |