Support vector machines for credit scoring

Thesis title: Support vector machines for credit scoring
Author: Haltuf, Michal
Thesis type: Diploma thesis
Supervisor: Witzany, Jiří
Opponents: Kolman, Marek
Thesis language: English
Abstract:
Quantitative methods to assess the creditworthiness of the loan applicants are vital for the profitability and the transparency of the lending business. With the total loan volumes typical for traditional financial institutions, even the slightest improvement in credit scoring models can translate into substantial additional profit. Yet for the regulatory reasons and due to the potential model risk, banks tend to be reluctant to replace the logistic regression as an industrial standard with the new algorithms. This does not stop researchers from examining such new approaches, though. This thesis discusses the potential of the support vector machines, to become an alternative to logistic regression in credit scoring. Using the real-life credit data set obtained from the P2P lending platform Bondora, the scoring models were built to compare the discrimination power of support vector machines against the traditional approach. The results of the comparison were ambiguous. The linear support vector machines performed worse than logistic regression and their training consumed much more time. On the other hand, support vector machines with non-linear kernel performed better than logistic regression and the difference was statistically significant at 95% level. Despite this success, several factors prevent SVM from the widespread applications in credit scoring, higher training times and lower robustness of the method being two of the major drawbacks. Considering the alternative algorithms which became available in the last 10 years, support vector machines cannot be recommended as a standalone method for credit risk models.
Keywords: peer to peer lending; credit scoring; logistic regression; support vector machines
Thesis title: Podpůrné vektorové stroje pro kreditní skóring
Author: Haltuf, Michal
Thesis type: Diplomová práce
Supervisor: Witzany, Jiří
Opponents: Kolman, Marek
Thesis language: English
Abstract:
Využití kreditních modelů v rozhodování o přidělení půjček retailovým zákazníkům je dnes ve finančním sektoru již běžnou záležitostí a představuje důležitou složku pro udržení ziskovosti i transparentnosti celého procesu. Při objemech, s nimiž poskytovatelé úvěrů běžně pracují, představuje i sebenepatrnější zlepšení účinnosti používaných modelů významné dodatečné zisky. Finanční instituce však (z důvodů regulatorních pravidel i z opatrnosti kvůli možnému modelovému riziku) preferují pro tyto účely logistickou regresi před novými a potenciálně účinnějšími metodami. To však neznamená, že by výzkum nových přístupů měl ustat. Podpůrné vektorové stroje (SVM) patří k těmto alternativním přístupům. Tato práce zkoumá možnost jejich uplatnění při tvorbě kreditních modelů. Srovnává výkonnost modelů založených na SVM oproti tradičnímu přístup pomocí logistické regrese, a to na reálných kreditních datech získaných z platformy zaměřené na P2P půjčky. Lineární verze podpůrných vektorových strojů byla v rozlišení dobrých a špatných dlužníků méně úspěšná než klasická logistická regrese. Naopak SVM model s nelinární jádrovou funkcí byl schopen logistickou regresi překonat a tento rozdíl ve výkonnosti byl statisticky významný. Navzdory tomuto dílčímu úspěchu se ale praktické využití podpůrných vektorových strojů v tomto oboru pojí s celou řadou obtíží, mezi něž patří dlouhá doba vývoje modelu a jeho nižší robustnost. Vezmeme-li v úvahu nové algoritmy, s nimiž odborná literatura přišla v posledních 10 letech a které jsou schopny soustavně dosahovat lepších výsledků, nelze metodu podpůrných vektorových strojů pro využití v kreditních modelech doporučit.
Keywords: p2p půjčky; kreditní skóring; svm; podpůrné vektorové stroje; logistická regrese

Information about study

Study programme: Finance a účetnictví/Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 10. 2. 2014
Date of submission: 31. 5. 2014
Date of defense: 18. 9. 2014
Identifier in the InSIS system: https://insis.vse.cz/zp/46349/podrobnosti

Files for download

    Last update: