Modeling the probability of purchase a credit card by a customer
Thesis title: | Modelování pravděpodobnosti pořízení kreditní karty zákazníkem |
---|---|
Author: | Sűlt, Adam |
Thesis type: | Diplomová práce |
Supervisor: | Formánek, Tomáš |
Opponents: | Macková, Simona |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá problematikou tvorby prediktivního modelu, který bude schopen seřadit klienty finanční instituce podle jejich pravděpodobnosti koupě kreditní karty. Jelikož se jedná o binární vysvětlovanou proměnnou, je zde použita logistická regrese jako jeden ze základních modelů binární volby. Nejdříve je uveden její teoretický popis s nejběžnějšími testy, které určují statistickou významnost modelu a jeho proměnných. Dále jsou představeny ukazatele diverzifikační schopnosti modelu, konkrétně Gini koeficient a Lift křivka. V praktické části práce jsou použita reálná data od jedné z největších finančních institucí v ČR. Z původního množství více než 600 prediktorů transformovaných metodou Weight of Evidence, jich bylo do výsledného modelu vybráno celkem 12. Stabilita modelu byla testována na data setu mimo období tréninkových dat, přičemž byla potvrzena diverzifikační schopnost modelu. |
Keywords: | Logistická regrese; prediktivní modelování; kreditní karta; Weight of Evidence; scoring |
Thesis title: | Modeling the probability of purchase a credit card by a customer |
---|---|
Author: | Sűlt, Adam |
Thesis type: | Diploma thesis |
Supervisor: | Formánek, Tomáš |
Opponents: | Macková, Simona |
Thesis language: | Česky |
Abstract: | The aim of this thesis is introduce the problematics about the creation of predictive model that would be able to rank client of a financial institutions according to their probability to acquire a credit card. Because of the binary target, logistic regression model is used as one of the basics models of binary choice. First is presented the theoretical description with the common test, which determine the statistical significance of the model and its variables. Then we present the indicators of the diversification power of the model, for example Gini coefficient and the Lift curve. Consequently, in the practical part of this thesis, are used real data from one of the biggest financial institution in Czech Republic. Of the more than 600 predictors, transformed by the Weight of Evidence, only 12 were selected for the resultant model. Model stability was tested at the data set outside of the training data period and the diversification ability of the model was confirmed. |
Keywords: | Logistic regression; predictive modeling; credit card; Weight of Evidence; scoring |
Information about study
Study programme: | Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Econometrics |
Information on submission and defense
Date of assignment: | 5. 12. 2018 |
---|---|
Date of submission: | 27. 6. 2019 |
Date of defense: | 9. 9. 2019 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/67958/podrobnosti |