Analysis and Prediction of Football Players' Market Value

Thesis title: Analýza a predikce tržní hodnoty fotbalových hráčů
Author: Houdek, Ondřej
Thesis type: Bakalářská práce
Supervisor: Chudán, David
Opponents: Zeman, Václav
Thesis language: Česky
Abstract:
Bakalářská práce se zabývá analýzou a predikcí tržní hodnoty fotbalových hráčů na základě jejich výkonnostních a statických dat. Zaměřuje se na hráče působící v anglické Premier League v období sedmi sezón (2017/2018–2023/2024), přičemž jako primární zdroje dat sloužily veřejně přístupné databáze. Hlavním cílem práce je vytvořit prediktivní model, který na základě historických dat odhaduje tržní hodnotu hráče na konci sezóny. Model využívá tržní hodnotu na začátku sezóny, neměnné charakteristiky hráče (např. národnost, preferovaná noha) a sezónní výkonnostní metriky. Nezanedbatelnou částí práce je samotná tvorba hlavního datasetu použitého pro modelování různých typů regresních modelů. Dataset obsahuje celkem 2230 záznamů reprezentujících hráče v jednotlivých sezónách, přičemž celkově jsou za vymezené období zpracována data týkající se 861 unikátních hráčů. Modely byly porovnávány na základě standardních regresních metrik (MAE, RMSE, MAPE a R²). Testované modely spadají do dvou skupin: lineární regresní modely a modely založené na rozhodovacích stromech. Stromové modely celkově zaznamenaly lepší výsledky než lineární, přičemž nejlepších výsledků dosáhl model XGBoost Regressor s hodnotami MAE 3,12 mil. € a R² 0,935.
Keywords: Python; přestupní trh; regresní modely; strojové učení; predikce tržní hodnoty; fotbal; vizualizace dat; zpracování dat
Thesis title: Analysis and Prediction of Football Players' Market Value
Author: Houdek, Ondřej
Thesis type: Bachelor thesis
Supervisor: Chudán, David
Opponents: Zeman, Václav
Thesis language: Česky
Abstract:
The bachelor thesis focuses on the analysis and prediction of the market value of football players based on their performance and static attributes. It concentrates on players active in the English Premier League over seven seasons (2017/2018-2023/2024), using publicly available databases as primary data sources. The main objective of the thesis is to develop a predictive model that estimates a player's market value at the end of the season using historical data. The model incorporates the player's initial market value, immutable characteristics (e.g., nationality, preferred foot), and seasonal performance metrics. A significant part of the thesis involves the construction of the main dataset used for training and evaluating different types of regression models. The dataset contains a total of 2230 records representing players across multiple seasons and covers data for 861 unique players. The models were evaluated using standard regression metrics (MAE, RMSE, MAPE and R²). The tested models fall into two categories: linear regression models and tree-based models. The tree-based models outperformed the linear ones overall, with the XGBoost Regressor achieving the best results, reaching a MAE of €3.12 million and an R² score of 0.935.
Keywords: data processing; data visualization; machine learning; Python; market value prediction; football; transfer market; regression models

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 15. 11. 2024
Date of submission: 10. 5. 2025
Date of defense: 24. 6. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/90372/podrobnosti

Files for download

    Last update: