Predictive analysis of customer churn

Thesis title: Prediktivní analýza odchodu zákazníků
Author: Shulha, Mykhailo
Thesis type: Bakalářská práce
Supervisor: Sokol, Ondřej
Opponents: Veverka, Lukáš
Thesis language: Česky
Abstract:
Tato práce se zaměřuje na prediktivní analýzu odchodu zákazníků, známou jako churn prediction, a na využití strojového učení pro identifikaci zákazníků, kteří jsou pravděpodobně ohroženi odchodem. Cílem je zjistit, jakým způsobem mohou firmy využít strojové učení, konkrétně algoritmy eXtreme Gradient Boosting a Support Vector Machine, k lepší predikci tohoto odchodu. V práci jsou podrobně popsány metody jako feature engineering, ladění hyperparametrů a techniky pro vyrovnání nevyvážených dat, jako je Syntetická menšinová převzorkovací technika. Dále se zaměřuje na analýzu datového souboru, jeho přípravu a vytváření nových atributů, které mohou být užitečné pro modelování. V rámci experimentů bylo testováno několik přístupů a výsledky ukázaly, že i přes určité problémy s identifikací menšinové třídy byly výsledky modelů přínosné a ukázaly směry pro další zlepšení. Práce také doporučuje zlepšit výběr atributů, optimalizaci hyperparametrů a rozšíření datového souboru pro lepší výsledky v budoucnu.
Keywords: analýza zákaznických dat; predikce odchodu zákazníků; chování spotřebitelů; Strojové učení
Thesis title: Predictive analysis of customer churn
Author: Shulha, Mykhailo
Thesis type: Bachelor thesis
Supervisor: Sokol, Ondřej
Opponents: Veverka, Lukáš
Thesis language: Česky
Abstract:
This thesis focuses on predictive analysis of customer churn and the use of machine learning to identify customers who are likely to churn. The goal is to explore how companies can leverage machine learning algorithms, specifically eXtreme Gradient Boosting and Support Vector Machine, to better predict customer churn. The paper details methods such as feature engineering, hyperparameter tuning, and techniques for handling imbalanced data, like Synthetic Minority Oversampling Technique. It also covers the analysis of the dataset, data preparation, and the creation of new features that may be useful for modeling. Experiments were conducted using various approaches, and the results revealed that while there were challenges in identifying the minority class, the models still provided valuable insights and pointed to directions for further improvement. The paper also suggests improving feature selection, optimizing hyperparameters, and expanding the dataset to achieve better results in the future.
Keywords: consumer behavior; Churn prediction; machine learning; customer data analysis

Information about study

Study programme: Data Analytics
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Econometrics

Information on submission and defense

Date of assignment: 1. 4. 2024
Date of submission: 11. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: