ANALYSIS OF FACTORS AFFECTING CLIENT PROFITABILITY

Thesis title: ANALYSIS OF FACTORS AFFECTING CLIENT PROFITABILITY
Author: Úředníček, Jan Adam
Thesis type: Bachelor thesis
Supervisor: Zimmermann, Pavel
Opponents: Sládek, Václav
Thesis language: English
Abstract:
This thesis investigates the effects of identifying and quantifying key financial and behavioral features on the prediction of Gross Income (GI) for micro and small segment enterprises at Raiffeisenbank. For this purpose, machine learning regression models are employed, utilizing client-level data on various financial activities, transactional behavior, and static attributes, along with the target variable of average gross income. The analysis focuses on identifying the most influential features and evaluating the predictive performance of different models. The three main findings are that (i) machine learning models can effectively predict a significant portion of the variability in GI, (ii) certain client financial and behavioral features, such as average asset and liability volumes, income, and international payment activity, emerge as strong positive predictors of GI, and (iii) a carefully selected subset of the most important features can achieve comparable or even slightly better predictive performance than models utilizing the entire feature set. This thesis represents an initial data-driven investigation into the drivers of Gross Income within Raiffeisenbank's micro and small enterprise client base using modern machine learning techniques.
Keywords: Banking; Machine Learning; Feature Importance; Gross Income Prediction; XGBoost
Thesis title: Analysis of factors affecting client profitability
Author: Úředníček, Jan Adam
Thesis type: Bakalářská práce
Supervisor: Zimmermann, Pavel
Opponents: Sládek, Václav
Thesis language: English
Abstract:
Tato práce zkoumá vliv identifikace a kvantifikace klíčových finančních a behaviorálních charakteristik na predikci hrubého zisku (HZ) pro mikropodniky a malé podniky v Raiffeisenbank. Za tímto účelem jsou použity regresní modely strojového učení, které využívají data na úrovni klientů zahrnující různé finanční aktivity, transakční chování a statické atributy, spolu s cílovou proměnnou průměrného hrubého zisku. Analýza se zaměřuje na identifikaci nejvlivnějších charakteristik a hodnocení prediktivní výkonnosti různých modelů. Tři hlavní zjištění jsou, že (i) modely strojového učení mohou efektivně predikovat významnou část variability HZ, (ii) určité finanční a behaviorální charakteristiky klientů, jako jsou průměrné objemy aktiv a pasiv, příjmy a aktivita mezinárodních plateb, se ukazují jako silné pozitivní prediktory HZ, a (iii) pečlivě vybraná podmnožina nejdůležitějších charakteristik může dosáhnout srovnatelné nebo dokonce mírně lepší prediktivní výkonnosti než modely využívající celou sadu charakteristik. Tato práce představuje úvodní datově orientované zkoumání faktorů ovlivňujících hrubý zisk v klientské bázi mikropodniků a malých podniků Raiffeisenbank s využitím moderních technik strojového učení.
Keywords: Predikce hrubého příjmu; Bankovnictví; Strojové učení; XGBoost; Feature Importance

Information about study

Study programme: Data Analytics
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 7. 5. 2025
Date of submission: 12. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: