The Estimation of Probability of Default Using Logistic Regression

Thesis title: Odhad pravděpodobnosti defaultu pomocí logistické regrese
Author: Chalupa, Tomáš
Thesis type: Bakalářská práce
Supervisor: Dlouhá, Zuzana
Opponents: Formánek, Tomáš
Thesis language: Česky
Abstract:
Cílem této práce je vytvořit vhodný model, který odhaduje pravděpodobnost nesplacení úvěru klientem. K odhadu byla použita logistická a probitová regrese a dvě definice nesplacení, 60 a 90 dnů po splatnosti. V práci je popsán způsob výstavby, odhadu a testování skóringových modelů a také struktura použitých dat, která byla použita v praktické části práce. Nejprve byl vytvořen teoretický model, který byl později konfrontován s odhady. Vytvořené modely byly porovnány v práci popsanými statistikami jako je McFaddenovo R^2, schopnost jejich diverzifikace byla zjišťována Lorenzovou křivkou a Giniho koeficientem. Bylo zjištěno, že logistická a probitová regrese mají téměř stejné výsledky a že 90 dnů je vhodnější definice než 60 dnů.
Keywords: probitová regrese; Giniho koeficient; skóring; logistická regrese; pravděpodobnost defaultu
Thesis title: The Estimation of Probability of Default Using Logistic Regression
Author: Chalupa, Tomáš
Thesis type: Bachelor thesis
Supervisor: Dlouhá, Zuzana
Opponents: Formánek, Tomáš
Thesis language: Česky
Abstract:
The aim of this work is to develop a suitable model that estimates a probability of default of client's loan. As estimation method was used a logistic regression and a probit regression and two definitions of default, 60 and 90 days overdue. The work describes the method of construction, estimation and testing of scoring models and a structure of dataset, which was used in the practical part. Firstly, it was created a theoretical model that was later confronted with estimates. Estimated models were compared by described statistics as McFadden R^2, the ability to diversify was investigated by the Lorenz curve and by the Gini coefficient. It was found that the logistic and the probit regressions have almost the same results, and that 90 days is preferable definition of default than 60 days.
Keywords: probability of default; scoring; logistic regression; Gini coefficient; probit regression

Information about study

Study programme: Kvantitativní metody v ekonomice/Matematické metody v ekonomii
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Econometrics

Information on submission and defense

Date of assignment: 26. 10. 2015
Date of submission: 13. 5. 2016
Date of defense: 21. 6. 2016
Identifier in the InSIS system: https://insis.vse.cz/zp/54968/podrobnosti

Files for download

Main text
Private file
Download
    Last update: