Analýza a predikce tržní hodnoty fotbalových hráčů
Název práce: | Analýza a predikce tržní hodnoty fotbalových hráčů |
---|---|
Autor(ka) práce: | Houdek, Ondřej |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Zeman, Václav |
Jazyk práce: | Česky |
Abstrakt: | Bakalářská práce se zabývá analýzou a predikcí tržní hodnoty fotbalových hráčů na základě jejich výkonnostních a statických dat. Zaměřuje se na hráče působící v anglické Premier League v období sedmi sezón (2017/2018–2023/2024), přičemž jako primární zdroje dat sloužily veřejně přístupné databáze. Hlavním cílem práce je vytvořit prediktivní model, který na základě historických dat odhaduje tržní hodnotu hráče na konci sezóny. Model využívá tržní hodnotu na začátku sezóny, neměnné charakteristiky hráče (např. národnost, preferovaná noha) a sezónní výkonnostní metriky. Nezanedbatelnou částí práce je samotná tvorba hlavního datasetu použitého pro modelování různých typů regresních modelů. Dataset obsahuje celkem 2230 záznamů reprezentujících hráče v jednotlivých sezónách, přičemž celkově jsou za vymezené období zpracována data týkající se 861 unikátních hráčů. Modely byly porovnávány na základě standardních regresních metrik (MAE, RMSE, MAPE a R²). Testované modely spadají do dvou skupin: lineární regresní modely a modely založené na rozhodovacích stromech. Stromové modely celkově zaznamenaly lepší výsledky než lineární, přičemž nejlepších výsledků dosáhl model XGBoost Regressor s hodnotami MAE 3,12 mil. € a R² 0,935. |
Klíčová slova: | Python; přestupní trh; regresní modely; strojové učení; predikce tržní hodnoty; fotbal; vizualizace dat; zpracování dat |
Název práce: | Analysis and Prediction of Football Players' Market Value |
---|---|
Autor(ka) práce: | Houdek, Ondřej |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Zeman, Václav |
Jazyk práce: | Česky |
Abstrakt: | The bachelor thesis focuses on the analysis and prediction of the market value of football players based on their performance and static attributes. It concentrates on players active in the English Premier League over seven seasons (2017/2018-2023/2024), using publicly available databases as primary data sources. The main objective of the thesis is to develop a predictive model that estimates a player's market value at the end of the season using historical data. The model incorporates the player's initial market value, immutable characteristics (e.g., nationality, preferred foot), and seasonal performance metrics. A significant part of the thesis involves the construction of the main dataset used for training and evaluating different types of regression models. The dataset contains a total of 2230 records representing players across multiple seasons and covers data for 861 unique players. The models were evaluated using standard regression metrics (MAE, RMSE, MAPE and R²). The tested models fall into two categories: linear regression models and tree-based models. The tree-based models outperformed the linear ones overall, with the XGBoost Regressor achieving the best results, reaching a MAE of €3.12 million and an R² score of 0.935. |
Klíčová slova: | data processing; data visualization; machine learning; Python; market value prediction; football; transfer market; regression models |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 15. 11. 2024 |
---|---|
Datum podání práce: | 10. 5. 2025 |
Datum obhajoby: | 24. 6. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/90372/podrobnosti |