Sample selection bias and the evidence from a financial market

Thesis title: Sample selection bias and the evidence from a financial market
Author: Komárek, Martin
Thesis type: Diploma thesis
Supervisor: Miklánek, Tomáš
Opponents: Chytilová, Helena
Thesis language: English
Abstract:
The aim of the diploma thesis is to introduce the methodology and several approaches previously used to account for the sample selection bias. The focus of the thesis is primarily on the consumer lending where the selection bias is unavoidable. Financial data about consumers are provided by a Czech commercial bank. The data are split into rejected and accepted accounts which is a source of the selection bias. Reject inference is a method to exploit the information about the rejected accounts to improve the predictive performance and remove the selection bias. The methods used for the analysis are fuzzy augmentation, Heckman’s two stage correction, parceling, augmentation (reweighting) and reclassification. First, an application scorecard is developed using the known observations. The reject inference models are fitted on the through the door population. Results show that only Heckman’s two step correction method is giving satisfactory results and that a modest improvement in the scorecard is possible.
Keywords: Selection bias; application scorecard; reject inference
Thesis title: Výběrové zkreslení a důkaz z finančního trhu
Author: Komárek, Martin
Thesis type: Diplomová práce
Supervisor: Miklánek, Tomáš
Opponents: Chytilová, Helena
Thesis language: English
Abstract:
Cílem diplomové práce je představit metodiku a několik běžně používaných přístupů k zohlednění výběrového zkreslení. Práce se zaměřuje především na spotřebitelské půjčky, u nichž existuje nevyhnutelné zkreslení výběru. Finanční data o spotřebitelích jsou poskytnuty jednou z českých komerčních bank. Data jsou rozdělena na odmítnuté a přijaté účty, což je zdrojem zkreslení výběru. Reject inference je metoda, která využívá informace o odmítnutých účtech ke zlepšení prediktivních vlastností modelu a odstranění zkreslení výběru. Metody použité pro analýzu jsou fuzzy augmentace, Heckmanova dvoustupňová korekce, parceling, augmentace (reweighting) a reklasifikace. Nejprve se na základě známých údajů vyvine aplikační karta. Modely pro reject inference jsou odhadnuty na pozorovaných i nepozorovaných datech. Výsledky ukazují, že pouze Heckmanova dvou kroková korekce poskytuje uspokojivé výsledky a že je možné mírné zlepšení v síle skóringového modelu.
Keywords: Výběrové zkreslení; aplikační skórkarta; reklasifikace

Information about study

Study programme: Ekonomie a hospodářská správa/Ekonomická analýza
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Economics
Department: Department of Economics

Information on submission and defense

Date of assignment: 29. 9. 2020
Date of submission: 14. 5. 2021
Date of defense: 24. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/74364/podrobnosti

Files for download

    Last update: