Models of Churn Probabilities of Clients of Financial Institutions

Thesis title: Models of Churn Probabilities of Clients of Financial Institutions
Author: Houšková, Helena
Thesis type: Diploma thesis
Supervisor: Černý, Michal
Opponents: Formánek, Tomáš
Thesis language: English
Abstract:
The aim of this thesis is to create models that will predict the probability of client churn during mortgage refixation from a year to six months in advance using three different methods. Separate models are made for the clients who applied for the loan directly in the bank and for those that applied through a broker. The reason is different churn rate in these two groups as well as possibility tu use additional variables for the second group of clients. The used methods are logistic regression, regression tree and random forest. Models are compared with each other as well as with the model that is currently used in the bank. To compare the models the Gini coefficient and the confusion matrix are used. For both groups of clients, the best model is the random forest, which has the highest Gini coefficient on the test sample.
Keywords: client churn probability; regression tree; logistic regression; random forest
Thesis title: Modely pravděpodobností odchodu klientů finančních institucí
Author: Houšková, Helena
Thesis type: Diplomová práce
Supervisor: Černý, Michal
Opponents: Formánek, Tomáš
Thesis language: English
Abstract:
Cílem této práce je za pomoci tří různých metod vytvořit modely, které budou v předstihu rok až šest měsíců predikovat pravděpodobnost odchodu klienta ke konkurenci v čase refixace hypotéky. Modely jsou vytvořeny zvlášť pro klienty, kteří si hypotéku vyřídili přímo v dané bance, a zvlášť pro klienty, kteří si hypotéku sjednali přes brokera. Důvodem je rozdílná odchodovost v těchto dvou skupinách a možnost využití více proměnných u druhé skupiny klientů. Použité metody jsou logistická regrese, regresní strom a náhodný les. Modely jsou porovnány mezi sebou a také s modelem, který banka používá v současnosti. K porovnání modelů je použit Gini koeficient a matice záměn. Pro obě skupiny klientů je nejlepším modelem náhodný les, který dosahuje nejvyšších hodnot Giniho koeficientu na testovacím vzorku.
Keywords: pravděpodobnost odchodu klienta; logistická regrese; regresní strom; náhodný les

Information about study

Study programme: Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Econometrics

Information on submission and defense

Date of assignment: 10. 12. 2018
Date of submission: 26. 6. 2019
Date of defense: 9. 9. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/68019/podrobnosti

Files for download

Main text
Private file
Download
    Last update: