Prediction of bank customers' purchasing behavior for the optimization of marketing campaigns

Thesis title: Predikce nákupního chování klientů banky pro optimalizaci marketingových kampaní
Author: Šarin, Kristijan
Thesis type: Bakalářská práce
Supervisor: Bína, Vladislav
Opponents: Přibil, Jiří
Thesis language: Česky
Abstract:
Tato práce zkoumá predikci nákupního chování klientů banky. Cílem práce bylo vytvořit model náhodného lesa pro optimalizaci marketingových kampaní. Model využil datové sady z různých digitálních kanálů. Data byla nejprve sloučena, očištěna a obohacena o nové atributy. Dále byl vytvořen klasifikační model náhodného lesa. Model prošel optimalizací pomocí GridSearchCV a pětinásobnou křížovou validací. Model dosáhl hodnoty ROC-AUC 0,8564 na testovací množině a celkové přesnosti 76 %. F1-skóre činilo 0,76. Model tak dokáže rozlišovat mezi zákazníky s různou pravděpodobností nákupu. Poté byla provedena segmentace klientů do čtyř skupin. Každé skupině bylo přiřazeno cílené marketingové doporučení. Výsledky práce potvrzují, že analýzu digitálních interakcí lze efektivně využít k personalizaci kampaní a zvýšení návratnosti investic.
Keywords: náhodný les; predikce; strojové učení; marketingová segmentace
Thesis title: Prediction of bank customers' purchasing behavior for the optimization of marketing campaigns
Author: Šarin, Kristijan
Thesis type: Bachelor thesis
Supervisor: Bína, Vladislav
Opponents: Přibil, Jiří
Thesis language: Česky
Abstract:
This thesis explores the prediction of bank clients' purchasing behavior. The aim was to develop a Random Forest model to optimize marketing campaigns. The model utilized datasets from various digital channels. The data were first merged, cleaned, and enriched with new attributes. Subsequently, a Random Forest classification model was built. The model was optimized using GridSearchCV and validated through five-fold cross-validation. It achieved a ROC-AUC score of 0.8564 on the test set and an overall accuracy of 76%. The F1-score for the purchase class was 0.76. This indicates the model's ability to distinguish between customers with different purchase probabilities. Clients were then segmented into four groups, each receiving a targeted marketing recommendation. The results confirm that analyzing digital interactions can be effectively used to personalize campaigns and increase return on investment.
Keywords: machine learning; prediction; marketing segmentation; random forest

Information about study

Study programme: Management
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty:
Department:

Information on submission and defense

Date of assignment: 15. 10. 2021
Date of submission: 30. 6. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: