Modeling the probability of purchase a credit card by a customer

Thesis title: Modelování pravděpodobnosti pořízení kreditní karty zákazníkem
Author: Sűlt, Adam
Thesis type: Diplomová práce
Supervisor: Formánek, Tomáš
Opponents: Macková, Simona
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá problematikou tvorby prediktivního modelu, který bude schopen seřadit klienty finanční instituce podle jejich pravděpodobnosti koupě kreditní karty. Jelikož se jedná o binární vysvětlovanou proměnnou, je zde použita logistická regrese jako jeden ze základních modelů binární volby. Nejdříve je uveden její teoretický popis s nejběžnějšími testy, které určují statistickou významnost modelu a jeho proměnných. Dále jsou představeny ukazatele diverzifikační schopnosti modelu, konkrétně Gini koeficient a Lift křivka. V praktické části práce jsou použita reálná data od jedné z největších finančních institucí v ČR. Z původního množství více než 600 prediktorů transformovaných metodou Weight of Evidence, jich bylo do výsledného modelu vybráno celkem 12. Stabilita modelu byla testována na data setu mimo období tréninkových dat, přičemž byla potvrzena diverzifikační schopnost modelu.
Keywords: Logistická regrese; prediktivní modelování; kreditní karta; Weight of Evidence; scoring
Thesis title: Modeling the probability of purchase a credit card by a customer
Author: Sűlt, Adam
Thesis type: Diploma thesis
Supervisor: Formánek, Tomáš
Opponents: Macková, Simona
Thesis language: Česky
Abstract:
The aim of this thesis is introduce the problematics about the creation of predictive model that would be able to rank client of a financial institutions according to their probability to acquire a credit card. Because of the binary target, logistic regression model is used as one of the basics models of binary choice. First is presented the theoretical description with the common test, which determine the statistical significance of the model and its variables. Then we present the indicators of the diversification power of the model, for example Gini coefficient and the Lift curve. Consequently, in the practical part of this thesis, are used real data from one of the biggest financial institution in Czech Republic. Of the more than 600 predictors, transformed by the Weight of Evidence, only 12 were selected for the resultant model. Model stability was tested at the data set outside of the training data period and the diversification ability of the model was confirmed.
Keywords: Logistic regression; predictive modeling; credit card; Weight of Evidence; scoring

Information about study

Study programme: Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Econometrics

Information on submission and defense

Date of assignment: 5. 12. 2018
Date of submission: 27. 6. 2019
Date of defense: 9. 9. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/67958/podrobnosti

Files for download

    Last update: