Analysis and Prediction of Football Players' Market Value
Thesis title: | Analýza a predikce tržní hodnoty fotbalových hráčů |
---|---|
Author: | Houdek, Ondřej |
Thesis type: | Bakalářská práce |
Supervisor: | Chudán, David |
Opponents: | Zeman, Václav |
Thesis language: | Česky |
Abstract: | Bakalářská práce se zabývá analýzou a predikcí tržní hodnoty fotbalových hráčů na základě jejich výkonnostních a statických dat. Zaměřuje se na hráče působící v anglické Premier League v období sedmi sezón (2017/2018–2023/2024), přičemž jako primární zdroje dat sloužily veřejně přístupné databáze. Hlavním cílem práce je vytvořit prediktivní model, který na základě historických dat odhaduje tržní hodnotu hráče na konci sezóny. Model využívá tržní hodnotu na začátku sezóny, neměnné charakteristiky hráče (např. národnost, preferovaná noha) a sezónní výkonnostní metriky. Nezanedbatelnou částí práce je samotná tvorba hlavního datasetu použitého pro modelování různých typů regresních modelů. Dataset obsahuje celkem 2230 záznamů reprezentujících hráče v jednotlivých sezónách, přičemž celkově jsou za vymezené období zpracována data týkající se 861 unikátních hráčů. Modely byly porovnávány na základě standardních regresních metrik (MAE, RMSE, MAPE a R²). Testované modely spadají do dvou skupin: lineární regresní modely a modely založené na rozhodovacích stromech. Stromové modely celkově zaznamenaly lepší výsledky než lineární, přičemž nejlepších výsledků dosáhl model XGBoost Regressor s hodnotami MAE 3,12 mil. € a R² 0,935. |
Keywords: | Python; přestupní trh; regresní modely; strojové učení; predikce tržní hodnoty; fotbal; vizualizace dat; zpracování dat |
Thesis title: | Analysis and Prediction of Football Players' Market Value |
---|---|
Author: | Houdek, Ondřej |
Thesis type: | Bachelor thesis |
Supervisor: | Chudán, David |
Opponents: | Zeman, Václav |
Thesis language: | Česky |
Abstract: | The bachelor thesis focuses on the analysis and prediction of the market value of football players based on their performance and static attributes. It concentrates on players active in the English Premier League over seven seasons (2017/2018-2023/2024), using publicly available databases as primary data sources. The main objective of the thesis is to develop a predictive model that estimates a player's market value at the end of the season using historical data. The model incorporates the player's initial market value, immutable characteristics (e.g., nationality, preferred foot), and seasonal performance metrics. A significant part of the thesis involves the construction of the main dataset used for training and evaluating different types of regression models. The dataset contains a total of 2230 records representing players across multiple seasons and covers data for 861 unique players. The models were evaluated using standard regression metrics (MAE, RMSE, MAPE and R²). The tested models fall into two categories: linear regression models and tree-based models. The tree-based models outperformed the linear ones overall, with the XGBoost Regressor achieving the best results, reaching a MAE of €3.12 million and an R² score of 0.935. |
Keywords: | data processing; data visualization; machine learning; Python; market value prediction; football; transfer market; regression models |
Information about study
Study programme: | Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 15. 11. 2024 |
---|---|
Date of submission: | 10. 5. 2025 |
Date of defense: | 24. 6. 2025 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/90372/podrobnosti |