Data-driven scouting model for identifying promising players for the needs of the Widzew Łódź club

Thesis title: Návrh dátovo orientovaného skautingového modelu pre identifikáciu perspektívnych hráčov pre potreby klubu Widzew Łódź
Author: Pôbiš, Lukáš
Thesis type: Diploma thesis
Supervisor: Zimmermann, Pavel
Opponents: Krejčí, Jiří
Thesis language: Slovensky
Abstract:
Hlavným cieľom diplomovej práce je návrh a následná implementácia dátovo orientovaného skautingového modelu, ktorý je primárne určený na identifikáciu perspektívnych futbalových hráčov pre potreby klubu Widzew Łódź. Práca je rozdelená na tri logické celky. Prvá časť sa zaoberá zoznámením čitateľa s problematikou futbalovej analytiky, ekonomickým kontextom prestupového trhu a analýzou súčasných skautingových procesov. Následne sa práca zameriava na metodológiu vývoja modelu, kde je popísaný proces zberu dát z platformy Wyscout a využitie algoritmov strojového učenia, konkrétne metódy Random Forest pre stanovenie váh jednotlivých metrík špecifických pre každú hráčsku pozíciu. Druhá časť, ktorá je hlavnou zložkou tejto práce, prináša samotnú technickú implementáciu modelu v jazyku Python. V tejto časti je definovaná unikátna metrika „Widzew Score“, ktorá integruje výkonnostné dáta s koeficientmi náročnosti líg a transformuje ich pomocou kumulatívnych distribučných funkcií. Výstupom diplomovej práce je vytvorenie vizualizačnej vrstvy pre interpretáciu výsledkov vo forme radarových grafov a identifikácia konkrétnych hráčov pre shortlist klubu. Práca končí zhodnotením úspešnosti modelu prostredníctvom spätnej validácie a súhrnom odporúčaní pre budúce pokračovanie rozvoja modelu v oblasti profesionálneho futbalu.
Keywords: Futbalová analytika; Strojové učenie; Widzew Score; Random Forest; Skauting; Python; Widzew Łódź
Thesis title: Návrh datově orientovaného scoutingového modelu pro identifikaci perspektivních hráčů pro potřeby klubu Widzew Łódź
Author: Pôbiš, Lukáš
Thesis type: Diplomová práce
Supervisor: Zimmermann, Pavel
Opponents: Krejčí, Jiří
Thesis language: Slovensky
Abstract:
Hlavním cílem diplomové práce je návrh a následná implementace datově orientovaného skautingového modelu, který je primárně určen k identifikaci perspektivních fotbalových hráčů pro potřeby klubu Widzew Łódź. Práce je rozdělena na tři logické celky. První část se zabývá seznámením čtenáře s problematikou fotbalové analytiky, ekonomickým kontextem přestupního trhu a analýzou současných skautingových procesů. Následně se práce zaměřuje na metodologii vývoje modelu, kde je popsán proces sběru dat z platformy Wyscout a využití algoritmů strojového učení, konkrétně metody Random Forest pro stanovení vah jednotlivých metrik specifických pro každou hráčskou pozici. Druhá část, která je hlavní složkou této práce, přináší samotnou technickou implementaci modelu v jazyce Python. V této části je definována unikátní metrika „Widzew Score“, která integruje výkonnostní data s koeficienty náročnosti lig a transformuje je pomocí kumulativních distribučních funkcí. Výstupem diplomové práce je vytvoření vizualizační vrstvy pro interpretaci výsledků ve formě radarových grafů a identifikace konkrétních hráčů pro shortlist klubu. Práce končí zhodnocením úspěšnosti modelu prostřednictvím zpětné validace a souhrnem doporučení pro budoucí pokračování rozvoje modelu v oblasti profesionálního fotbalu.
Keywords: Widzew Score; Random Forest; Fotbalová analytika; Skauting; Widzew Łódź; Strojní učení; Python
Thesis title: Data-driven scouting model for identifying promising players for the needs of the Widzew Łódź club
Author: Pôbiš, Lukáš
Thesis type: Diploma thesis
Supervisor: Zimmermann, Pavel
Opponents: Krejčí, Jiří
Thesis language: Slovensky
Abstract:
The main goal of the thesis is the design and subsequent implementation of a data-driven scouting model which is primarily intended to identify prospective football players for the needs of the Widzew Łódź club. The thesis is divided into three logical parts. The first part deals with introducing the reader to the topic of football analytics, the economic context of the transfer market, and an analysis of current scouting processes. Subsequently, the thesis focuses on the model development methodology, describing the data collection process from the Wyscout platform and the use of machine learning algorithms, specifically the Random Forest method, to determine weights for individual metrics specific to each playing position. The second part, which is the main part of this thesis, presents the actual technical implementation of the model in Python. In this section, a unique metric called the "Widzew Score" is defined, which integrates performance data with league difficulty coefficients and transforms them using cumulative distribution functions. The output of the diploma thesis is the creation of a visualization layer for the interpretation of results in the form of radar charts and the identification of specific players for the club's shortlist. The thesis concludes with an evaluation of the model's success through back-testing and a summary of recommendations for the future development of the model in the professional football industry.
Keywords: Widzew Łódź; Python; Widzew Score; Scouting; Random Forest; Football analytics; Machine learning

Information about study

Study programme: Aplikovaná datová analytika a umělá inteligence/Datová analytika v marketingu a e-commerce
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 5. 12. 2025
Date of submission: 2. 5. 2026
Date of defense: 2. 6. 2026
Identifier in the InSIS system: https://insis.vse.cz/zp/94821/podrobnosti

Files for download

    Last update: