Modely pravděpodobností odchodu klientů finančních institucí
Název práce: | Models of Churn Probabilities of Clients of Financial Institutions |
---|---|
Autor(ka) práce: | Houšková, Helena |
Typ práce: | Diploma thesis |
Vedoucí práce: | Černý, Michal |
Oponenti práce: | Formánek, Tomáš |
Jazyk práce: | English |
Abstrakt: | The aim of this thesis is to create models that will predict the probability of client churn during mortgage refixation from a year to six months in advance using three different methods. Separate models are made for the clients who applied for the loan directly in the bank and for those that applied through a broker. The reason is different churn rate in these two groups as well as possibility tu use additional variables for the second group of clients. The used methods are logistic regression, regression tree and random forest. Models are compared with each other as well as with the model that is currently used in the bank. To compare the models the Gini coefficient and the confusion matrix are used. For both groups of clients, the best model is the random forest, which has the highest Gini coefficient on the test sample. |
Klíčová slova: | client churn probability; regression tree; logistic regression; random forest |
Název práce: | Modely pravděpodobností odchodu klientů finančních institucí |
---|---|
Autor(ka) práce: | Houšková, Helena |
Typ práce: | Diplomová práce |
Vedoucí práce: | Černý, Michal |
Oponenti práce: | Formánek, Tomáš |
Jazyk práce: | English |
Abstrakt: | Cílem této práce je za pomoci tří různých metod vytvořit modely, které budou v předstihu rok až šest měsíců predikovat pravděpodobnost odchodu klienta ke konkurenci v čase refixace hypotéky. Modely jsou vytvořeny zvlášť pro klienty, kteří si hypotéku vyřídili přímo v dané bance, a zvlášť pro klienty, kteří si hypotéku sjednali přes brokera. Důvodem je rozdílná odchodovost v těchto dvou skupinách a možnost využití více proměnných u druhé skupiny klientů. Použité metody jsou logistická regrese, regresní strom a náhodný les. Modely jsou porovnány mezi sebou a také s modelem, který banka používá v současnosti. K porovnání modelů je použit Gini koeficient a matice záměn. Pro obě skupiny klientů je nejlepším modelem náhodný les, který dosahuje nejvyšších hodnot Giniho koeficientu na testovacím vzorku. |
Klíčová slova: | pravděpodobnost odchodu klienta; logistická regrese; regresní strom; náhodný les |
Informace o studiu
Studijní program / obor: | Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra ekonometrie |
Informace o odevzdání a obhajobě
Datum zadání práce: | 10. 12. 2018 |
---|---|
Datum podání práce: | 26. 6. 2019 |
Datum obhajoby: | 9. 9. 2019 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/68019/podrobnosti |
Soubory ke stažení
Hlavní práce
Neveřejný soubor Stáhnout
Neveřejný soubor Stáhnout