Thesis title: |
ANALYSIS OF FACTORS AFFECTING CLIENT PROFITABILITY |
Author: |
Úředníček, Jan Adam |
Thesis type: |
Bachelor thesis |
Supervisor: |
Zimmermann, Pavel |
Opponents: |
Sládek, Václav |
Thesis language: |
English |
Abstract: |
This thesis investigates the effects of identifying and quantifying key financial and behavioral features on the prediction of Gross Income (GI) for micro and small segment enterprises at Raiffeisenbank. For this purpose, machine learning regression models are employed, utilizing client-level data on various financial activities, transactional behavior, and static attributes, along with the target variable of average gross income. The analysis focuses on identifying the most influential features and evaluating the predictive performance of different models. The three main findings are that (i) machine learning models can effectively predict a significant portion of the variability in GI, (ii) certain client financial and behavioral features, such as average asset and liability volumes, income, and international payment activity, emerge as strong positive predictors of GI, and (iii) a carefully selected subset of the most important features can achieve comparable or even slightly better predictive performance than models utilizing the entire feature set. This thesis represents an initial data-driven investigation into the drivers of Gross Income within Raiffeisenbank's micro and small enterprise client base using modern machine learning techniques. |
Keywords: |
Banking; Machine Learning; Feature Importance; Gross Income Prediction; XGBoost |
Thesis title: |
Analysis of factors affecting client profitability |
Author: |
Úředníček, Jan Adam |
Thesis type: |
Bakalářská práce |
Supervisor: |
Zimmermann, Pavel |
Opponents: |
Sládek, Václav |
Thesis language: |
English |
Abstract: |
Tato práce zkoumá vliv identifikace a kvantifikace klíčových finančních a behaviorálních charakteristik na predikci hrubého zisku (HZ) pro mikropodniky a malé podniky v Raiffeisenbank. Za tímto účelem jsou použity regresní modely strojového učení, které využívají data na úrovni klientů zahrnující různé finanční aktivity, transakční chování a statické atributy, spolu s cílovou proměnnou průměrného hrubého zisku. Analýza se zaměřuje na identifikaci nejvlivnějších charakteristik a hodnocení prediktivní výkonnosti různých modelů. Tři hlavní zjištění jsou, že (i) modely strojového učení mohou efektivně predikovat významnou část variability HZ, (ii) určité finanční a behaviorální charakteristiky klientů, jako jsou průměrné objemy aktiv a pasiv, příjmy a aktivita mezinárodních plateb, se ukazují jako silné pozitivní prediktory HZ, a (iii) pečlivě vybraná podmnožina nejdůležitějších charakteristik může dosáhnout srovnatelné nebo dokonce mírně lepší prediktivní výkonnosti než modely využívající celou sadu charakteristik. Tato práce představuje úvodní datově orientované zkoumání faktorů ovlivňujících hrubý zisk v klientské bázi mikropodniků a malých podniků Raiffeisenbank s využitím moderních technik strojového učení. |
Keywords: |
Predikce hrubého příjmu; Bankovnictví; Strojové učení; XGBoost; Feature Importance |
Information about study
Study programme: |
Data Analytics |
Type of study programme: |
Bakalářský studijní program |
Assigned degree: |
Bc. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Information Technologies |
Information on submission and defense
Date of assignment: |
7. 5. 2025 |
Date of submission: |
12. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.