Models of Churn Probabilities of Clients of Financial Institutions
Thesis title: | Models of Churn Probabilities of Clients of Financial Institutions |
---|---|
Author: | Houšková, Helena |
Thesis type: | Diploma thesis |
Supervisor: | Černý, Michal |
Opponents: | Formánek, Tomáš |
Thesis language: | English |
Abstract: | The aim of this thesis is to create models that will predict the probability of client churn during mortgage refixation from a year to six months in advance using three different methods. Separate models are made for the clients who applied for the loan directly in the bank and for those that applied through a broker. The reason is different churn rate in these two groups as well as possibility tu use additional variables for the second group of clients. The used methods are logistic regression, regression tree and random forest. Models are compared with each other as well as with the model that is currently used in the bank. To compare the models the Gini coefficient and the confusion matrix are used. For both groups of clients, the best model is the random forest, which has the highest Gini coefficient on the test sample. |
Keywords: | client churn probability; regression tree; logistic regression; random forest |
Thesis title: | Modely pravděpodobností odchodu klientů finančních institucí |
---|---|
Author: | Houšková, Helena |
Thesis type: | Diplomová práce |
Supervisor: | Černý, Michal |
Opponents: | Formánek, Tomáš |
Thesis language: | English |
Abstract: | Cílem této práce je za pomoci tří různých metod vytvořit modely, které budou v předstihu rok až šest měsíců predikovat pravděpodobnost odchodu klienta ke konkurenci v čase refixace hypotéky. Modely jsou vytvořeny zvlášť pro klienty, kteří si hypotéku vyřídili přímo v dané bance, a zvlášť pro klienty, kteří si hypotéku sjednali přes brokera. Důvodem je rozdílná odchodovost v těchto dvou skupinách a možnost využití více proměnných u druhé skupiny klientů. Použité metody jsou logistická regrese, regresní strom a náhodný les. Modely jsou porovnány mezi sebou a také s modelem, který banka používá v současnosti. K porovnání modelů je použit Gini koeficient a matice záměn. Pro obě skupiny klientů je nejlepším modelem náhodný les, který dosahuje nejvyšších hodnot Giniho koeficientu na testovacím vzorku. |
Keywords: | pravděpodobnost odchodu klienta; logistická regrese; regresní strom; náhodný les |
Information about study
Study programme: | Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Econometrics |
Information on submission and defense
Date of assignment: | 10. 12. 2018 |
---|---|
Date of submission: | 26. 6. 2019 |
Date of defense: | 9. 9. 2019 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/68019/podrobnosti |
Files for download
Main text
Private file Download
Private file Download