Data Mining and use of decision trees by creation of Scorecards

Thesis title: Datamining a využití rozhodovacích stromů při tvorbě Scorecards
Author: Straková, Kristýna
Thesis type: Diplomová práce
Supervisor: Witzany, Jiří
Opponents: Fičura, Milan
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá porovnáním několika vybraných modelovacích metod, které používají finanční instituce (a nejen ty) ve svých rozhodovacích procesech. Ve své první části se teoreticky zabývá nejznámějšími modelovacími metodami, jako je logistická regrese, rozhodovací stromy, neuronové sítě, alternující rozhodovací stromy a poměrně novou metodou nazvanou "Random forest", kterou můžeme doslovně přeložit jako náhodný les. V praktické části této diplomové práce jsou nejprve nastíněny některé procesy uvnitř finančních institucí, ve kterých jsou dané modelovací metody využívány. Na reálných datech dvou finančních institucí jsou mezi sebou srovnávány metody logistické regrese, rozhodovacích stromů a rozhodovacího lesa. Metoda neuronové sítě do porovnání zahrnuta není. Důvodem je především velmi náročná interpretovatelnost výsledků této metody. V závěru se pak práce na základě výsledných modelů snaží odpovědět na otázku, zda je doposud nejpoužívanější metoda logistické regrese tou nejvhodnější.
Keywords: logistická regrese; Rozhodovací stromy; predelikventní skóringový model; aplikační skóringový model; náhodný les
Thesis title: Data Mining and use of decision trees by creation of Scorecards
Author: Straková, Kristýna
Thesis type: Diploma thesis
Supervisor: Witzany, Jiří
Opponents: Fičura, Milan
Thesis language: Česky
Abstract:
The thesis presents a comparison of several selected modeling methods used by financial institutions for (not exclusively) decision-making processes. First theoretical part describes well known modeling methods such as logistic regression, decision trees, neural networks, alternating decision trees and relatively new method called "Random forest". The practical part of thesis outlines some processes within financial institutions, in which selected modeling methods are used. On real data of two financial institutions logistic regression, decision trees and decision forest are compared which each other. Method of neural network is not included due to its complex interpretability. In conclusion, based on resulting models, thesis is trying to answers, whether logistic regression (method most widely used by financial institutions) remains most suitable.
Keywords: Decision trees; Pre-delinquent scoring model; random forest; application scoring model; logistic regression

Information about study

Study programme: Finance a účetnictví/Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 14. 2. 2014
Date of submission: 31. 5. 2014
Date of defense: 4. 2. 2016
Identifier in the InSIS system: https://insis.vse.cz/zp/46422/podrobnosti

Files for download

    Last update: