Kreditní skóring pomocí metod skupinového strojového učení
Název práce: | Credit Scoring Using Ensemble Machine Learning Methods |
---|---|
Autor(ka) práce: | Helcl, Jan |
Typ práce: | Diploma thesis |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Juhászová, Jana |
Jazyk práce: | English |
Abstrakt: | The aim of this thesis is to examine the performance of selected decision tree-based ensemble machine learning models and to assess their applicability in credit scoring. In the first part, general principles behind supervised machine learning were introduced. Selected ensemble models were then explained in detail, special focus was placed on decision trees, the building blocks of these models. The standard approach to credit scoring function development was introduced and used to develop a benchmark model. In last section, the ensemble models were trained in several different ways. Their out-of-sample performance was measured and compared to that of the benchmark. |
Klíčová slova: | ensemble machine learning; credit scoring; random forest; extremely randomized trees; AdaBoost; gradient boosting; logistic regression |
Název práce: | Kreditní skóring pomocí metod skupinového strojového učení |
---|---|
Autor(ka) práce: | Helcl, Jan |
Typ práce: | Diplomová práce |
Vedoucí práce: | Witzany, Jiří |
Oponenti práce: | Juhászová, Jana |
Jazyk práce: | English |
Abstrakt: | Cílem této práce je zhodnotit prediktivní sílu zvolených metod skupinového strojového učení založeného na rozhodovacích stromech a posoudit aplikovatelnost těchto modelů v kreditním skóringu. V první části byly vysvětleny základní principy strojového učení s učitelem. Zvolené metody skupinového strojového učení byly poté detailně popsány, zvláštní důraz byl kladen na popis rozhodovacích stromů jakožto základních stavebních prvků daných modelů. Standardní přístup ke kreditnímu skóringu byl popsán a použit pro vývoj referenčního modelu. Skupinové modely byly vyvinuty několika způsoby a jejich predikční síla byla porovnána s referenčním modelem. |
Klíčová slova: | skupinové strojové učení; kreditní skóring; náhodný les; extrémně náhodné stromy; AdaBoost; logistická regrese; gradient boosting |
Informace o studiu
Studijní program / obor: | Finance a účetnictví/Finanční inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta financí a účetnictví |
Katedra: | Katedra bankovnictví a pojišťovnictví |
Informace o odevzdání a obhajobě
Datum zadání práce: | 15. 2. 2018 |
---|---|
Datum podání práce: | 16. 8. 2018 |
Datum obhajoby: | 11. 9. 2018 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/64834/podrobnosti |