Building a logistic regression model in propensity modelling

Thesis title: Výstavba modelu logistické regrese v propenzitním modelování
Author: Štefanová, Lucie
Thesis type: Diplomová práce
Supervisor: Plašil, Miroslav
Opponents: Pecáková, Iva
Thesis language: Česky
Abstract:
Diplomová práce si klade za cíl představit metodu logistické regrese v kontextu propenzitního modelování a různé přístupy k výstavbě modelu s ohledem na problematiku vysokého množství vysvětlujících proměnných. Jako možná řešení tohoto problému je představena kroková regrese, regularizovaná regrese a metoda BMA (Bayesian model averaging). Jednotlivé přístupy jsou aplikovány na reálnou úlohu „propensity to buy“ z telekomunikačního odvětví, jejíž cílem je oskórovat zákaznickou bázi a vybrat zákazníky, kteří jsou nejvíce náchylní ke koupi televizního tarifu. Tento výběr probíhá za účelem oslovení marketingovou kampaní a podpoření prodeje produktu. V rámci jednotlivých přístupů byly testovány různé modifikace a na základě statistických a businessových kritérií byl vyhodnocen optimální model pro danou úlohu. Modely byly vyhodnoceny především pomocí hodnoty lift, která reprezentuje míru úspěšnosti kampaně. Jako nejúspěšnější byl zvolen model BMA s binomickým apriorním rozdělením pro počet proměnných v modelu a hodnotou Zellnerova g rovnou N, pro kterou model vykazoval nejvyšší hodnoty lift na prvním decilu. Rozdíl ve výkonostech jednotlivých přístupů však nebyl velký, protože hodnoty lift u ostatních metod dosahovaly hodnoty 3,50 oproti hodnotě 3,69 získané pomocí BMA.
Keywords: regularizovaná regrese; kroková regrese; propenzitní modelování; bayesian model averaging
Thesis title: Building a logistic regression model in propensity modelling
Author: Štefanová, Lucie
Thesis type: Diploma thesis
Supervisor: Plašil, Miroslav
Opponents: Pecáková, Iva
Thesis language: Česky
Abstract:
The aim of the thesis is to present the logistic regression method in the context of propensity modelling and different approaches to model construction with respect to the problem of high number of explanatory variables. Stepwise regression, regularized regression and Bayesian model averaging (BMA) method are presented as possible solutions to this problem. The different approaches are applied to a real-life „propensity to buy“ problem from the telecommunications industry, which aims to score the customer base and select the customers who are most likely to buy a TV tariff. This selection is done in order to reach them with a marketing campaign and to promote the sale of the product. Different modifications of each approach were tried and the optimal model for the task was evaluated based on statistical and business criteria. The models were mainly evaluated using the lift value, which represents the success rate of the campaign. The BMA model with a binomial apriori and a Zellner g value equal to N was chosen as the most successful model, achieving the highest lift value at the first decile. The difference in performance between the approaches was not large, as the lift values of the other methods reached 3,50 compared to the value of 3,69 obtained by BMA.
Keywords: peopensity modelling; stepwise regression; regularized regression; bayesian model averaging

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 2. 11. 2020
Date of submission: 5. 12. 2022
Date of defense: 31. 1. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/74961/podrobnosti

Files for download

    Last update: