Prediction of the success of football player transfers

Thesis title: Prediction of the success of football player transfers
Author: Trunečka, Marek
Thesis type: Bachelor thesis
Supervisor: Sokol, Ondřej
Opponents: Jablonský, Josef
Thesis language: English
Abstract:
Global spending on international transfer fees in men's professional football reached 8,59 billion US dollars in 2024, yet a substantial share of high-fee transfers fails to translate into regular playing time at the new club. This thesis examines whether pre-transfer on-field statistics can predict whether a transfer between clubs in the five major European leagues results in the player becoming a regular starter at his new club. A dataset combining transfer records from Transfermarkt with performance statistics from FBref and Understat is constructed, covering all transfers between top-five-league clubs across the 2016/17 to 2023/24 seasons. The dependent variable is binary, following Graham's 50 percent rule. Separate probit models are estimated for each of five position groups, with predictors selected by bidirectional stepwise selection using AIC. Out-of-sample sensitivity varies substantially by position, ranging from 67,5 percent for centre backs to 47,3 percent for midfielders. The retained predictors differ markedly across positions, validating a position-specific specification. Age remains a statistically significant predictor in four of the five models even when transfer fee is excluded, confirming its role as a genuine career-trajectory variable rather than a proxy for fee.
Keywords: position-specific models; European leagues; probit regression; transfer success; football transfers
Thesis title: Predikce úspěšnosti přestupů fotbalových hráčů
Author: Trunečka, Marek
Thesis type: Bakalářská práce
Supervisor: Sokol, Ondřej
Opponents: Jablonský, Josef
Thesis language: English
Abstract:
Globální výdaje na mezinárodní přestupové částky v mužském profesionálním fotbale dosáhly v roce 2024 hodnoty 8,59 miliardy amerických dolarů, přesto se podstatná část přestupů s vysokými částkami nepromítne do pravidelné herní vytíženosti v novém klubu. Tato práce zkoumá, zda lze na základě předpřestupových herních statistik předpovědět, zda přestup mezi kluby pěti hlavních evropských lig vyústí v to, že se hráč stane pravidelným členem základní sestavy svého nového klubu. Byl sestaven datový soubor kombinující přestupové záznamy z Transfermarktu s výkonnostními statistikami z FBref a Understatu, který pokrývá všechny přestupy mezi kluby top pěti lig napříč sezónami 2016/17 až 2023/24. Závislá proměnná je binární a vychází z Grahamova padesátiprocentního pravidla. Pro každou z pěti skupin pozic je odhadnut samostatný probitový model, přičemž prediktory jsou vybírány obousměrnou krokovou selekcí pomocí AIC. Senzitivita mimo trénovací vzorek se mezi pozicemi výrazně liší, pohybuje se od 69,4 procenta u útočníků až po 40,9 procenta u krajních obránců. Ponechané prediktory se mezi pozicemi výrazně odlišují, což potvrzuje opodstatněnost specifikace zvlášť pro každou pozici. Věk zůstává statisticky významným prediktorem ve čtyřech z pěti modelů i po vyloučení přestupové částky, což potvrzuje jeho roli skutečné proměnné kariérní trajektorie, nikoli pouze zástupné proměnné za přestupovou částku.
Keywords: fotbalové přestupy; evropské ligy; probit regrese; úspěšnost přestupu; modely specifické pro pozici

Information about study

Study programme: Data Analytics
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Econometrics

Information on submission and defense

Date of assignment: 25. 10. 2025
Date of submission: 10. 5. 2026
Date of defense: 23. 6. 2026
Identifier in the InSIS system: https://insis.vse.cz/zp/94251/podrobnosti

Files for download

    Last update: