Thesis title: |
Prediktivní analýza odchodu zákazníků |
Author: |
Shulha, Mykhailo |
Thesis type: |
Bakalářská práce |
Supervisor: |
Sokol, Ondřej |
Opponents: |
Veverka, Lukáš |
Thesis language: |
Česky |
Abstract: |
Tato práce se zaměřuje na prediktivní analýzu odchodu zákazníků, známou jako churn prediction, a na využití strojového učení pro identifikaci zákazníků, kteří jsou pravděpodobně ohroženi odchodem. Cílem je zjistit, jakým způsobem mohou firmy využít strojové učení, konkrétně algoritmy eXtreme Gradient Boosting a Support Vector Machine, k lepší predikci tohoto odchodu. V práci jsou podrobně popsány metody jako feature engineering, ladění hyperparametrů a techniky pro vyrovnání nevyvážených dat, jako je Syntetická menšinová převzorkovací technika. Dále se zaměřuje na analýzu datového souboru, jeho přípravu a vytváření nových atributů, které mohou být užitečné pro modelování. V rámci experimentů bylo testováno několik přístupů a výsledky ukázaly, že i přes určité problémy s identifikací menšinové třídy byly výsledky modelů přínosné a ukázaly směry pro další zlepšení. Práce také doporučuje zlepšit výběr atributů, optimalizaci hyperparametrů a rozšíření datového souboru pro lepší výsledky v budoucnu. |
Keywords: |
analýza zákaznických dat; predikce odchodu zákazníků; chování spotřebitelů; Strojové učení |
Thesis title: |
Predictive analysis of customer churn |
Author: |
Shulha, Mykhailo |
Thesis type: |
Bachelor thesis |
Supervisor: |
Sokol, Ondřej |
Opponents: |
Veverka, Lukáš |
Thesis language: |
Česky |
Abstract: |
This thesis focuses on predictive analysis of customer churn and the use of machine learning to identify customers who are likely to churn. The goal is to explore how companies can leverage machine learning algorithms, specifically eXtreme Gradient Boosting and Support Vector Machine, to better predict customer churn. The paper details methods such as feature engineering, hyperparameter tuning, and techniques for handling imbalanced data, like Synthetic Minority Oversampling Technique. It also covers the analysis of the dataset, data preparation, and the creation of new features that may be useful for modeling. Experiments were conducted using various approaches, and the results revealed that while there were challenges in identifying the minority class, the models still provided valuable insights and pointed to directions for further improvement. The paper also suggests improving feature selection, optimizing hyperparameters, and expanding the dataset to achieve better results in the future. |
Keywords: |
consumer behavior; Churn prediction; machine learning; customer data analysis |
Information about study
Study programme: |
Data Analytics |
Type of study programme: |
Bakalářský studijní program |
Assigned degree: |
Bc. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Econometrics |
Information on submission and defense
Date of assignment: |
1. 4. 2024 |
Date of submission: |
11. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.