The Estimation of Probability of Default Using Logistic Regression
Thesis title: | Odhad pravděpodobnosti defaultu pomocí logistické regrese |
---|---|
Author: | Chalupa, Tomáš |
Thesis type: | Bakalářská práce |
Supervisor: | Dlouhá, Zuzana |
Opponents: | Formánek, Tomáš |
Thesis language: | Česky |
Abstract: | Cílem této práce je vytvořit vhodný model, který odhaduje pravděpodobnost nesplacení úvěru klientem. K odhadu byla použita logistická a probitová regrese a dvě definice nesplacení, 60 a 90 dnů po splatnosti. V práci je popsán způsob výstavby, odhadu a testování skóringových modelů a také struktura použitých dat, která byla použita v praktické části práce. Nejprve byl vytvořen teoretický model, který byl později konfrontován s odhady. Vytvořené modely byly porovnány v práci popsanými statistikami jako je McFaddenovo R^2, schopnost jejich diverzifikace byla zjišťována Lorenzovou křivkou a Giniho koeficientem. Bylo zjištěno, že logistická a probitová regrese mají téměř stejné výsledky a že 90 dnů je vhodnější definice než 60 dnů. |
Keywords: | probitová regrese; Giniho koeficient; skóring; logistická regrese; pravděpodobnost defaultu |
Thesis title: | The Estimation of Probability of Default Using Logistic Regression |
---|---|
Author: | Chalupa, Tomáš |
Thesis type: | Bachelor thesis |
Supervisor: | Dlouhá, Zuzana |
Opponents: | Formánek, Tomáš |
Thesis language: | Česky |
Abstract: | The aim of this work is to develop a suitable model that estimates a probability of default of client's loan. As estimation method was used a logistic regression and a probit regression and two definitions of default, 60 and 90 days overdue. The work describes the method of construction, estimation and testing of scoring models and a structure of dataset, which was used in the practical part. Firstly, it was created a theoretical model that was later confronted with estimates. Estimated models were compared by described statistics as McFadden R^2, the ability to diversify was investigated by the Lorenz curve and by the Gini coefficient. It was found that the logistic and the probit regressions have almost the same results, and that 90 days is preferable definition of default than 60 days. |
Keywords: | probability of default; scoring; logistic regression; Gini coefficient; probit regression |
Information about study
Study programme: | Kvantitativní metody v ekonomice/Matematické metody v ekonomii |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Econometrics |
Information on submission and defense
Date of assignment: | 26. 10. 2015 |
---|---|
Date of submission: | 13. 5. 2016 |
Date of defense: | 21. 6. 2016 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/54968/podrobnosti |
Files for download
Main text
Private file Download
Private file Download