Predikce fotbalových zápasů Premier League

Název práce: Predikce fotbalových zápasů Premier League
Autor(ka) práce: Nguyen, Kevin
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Máša, Petr
Jazyk práce: Česky
Abstrakt:
Cílem bakalářská práce spočívá ve zjištění, zda je možné predikovat konečné výsledky fotbalových zápasu v anglické lize Premier League. Toto ověření se konkrétně provádělo tvorbou modelů zvolených metod a následnou analýzou výsledků získaných z vybraných výkonnostních metrik. Data byla získana z bezplatného webového portálu pro fotbalové sázení Football-Data.co.uk a pro predikci bylo využito 4180 odehraných fotbalových zápasů z posledních 10 zakončených sezón (2014-2025). V této práci se použily metody Logistické regrese, Support Vector Machines (SVM), eXtreme Gradient Boosting (XGBoost) a Naivní Bayes. Samotné aplikaci modelů předcházela kontrola kvality dat a explorační datová analýza (EDA), jejímž úkolem bylo získat základní charakteristiky o datasetu. Na základě výkonnostních metrik dosáhly vytvořené modely podobných výsledků. Společným znakem všech modelů byla nízká úspěšnost při predikci správných remíz, což indikuje, že problém nespočíval ve zvolených metodách, ale v nedostatečné schopnosti charakteristik predikovat remízu. Práce proto doporučuje pro budoucí výzkum implementovat pokročilejší metriky, které by přispěly ke zlepšení výkonnosti modelů.
Klíčová slova: strojové učení; ML; Logistická regrese; Support Vector Machines; SVM; eXtreme Gradient Boosting; XGBoost; Premier League; sport; fotbal; predikce
Název práce: Prediction of Premier League Football Matches
Autor(ka) práce: Nguyen, Kevin
Typ práce: Bachelor thesis
Vedoucí práce: Chudán, David
Oponenti práce: Máša, Petr
Jazyk práce: Česky
Abstrakt:
The aim of the bachelor's thesis is to determine whether it is possible to predict the outcomes of football matches in the English Premier League. This verification was specifically carried out by creating models using selected methods and subsequently analyzing the results obtained from chosen performance metrics. The data was acquired from the free web portal for football betting, Football-Data.co.uk, and 4180 played football matches from the last 10 completed seasons (2014-2025) were used for the prediction. The methods used in this work were Logistic Regression, Support Vector Machines (SVM), eXtreme Gradient Boosting (XGBoost), and Naive Bayes. The application of the models was preceded by data quality control and Exploratory Data Analysis (EDA), whose task was to obtain basic characteristics of the dataset. Based on the performance metrics, the developed models achieved similar results. A common characteristic of all models was their low success rate in predicting correct draws, which indicates that the problem was not with the chosen methods but with the insufficient ability of the characteristics to predict a draw. The thesis therefore recommends implementing more advanced metrics for future research, which would contribute to improving the performance of the models.
Klíčová slova: machine learning; ML; Logistic Regression; Support Vector Machines; SVM; sport; football; prediction; eXtreme Gradient Boosting; XGBoost; Premier League

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 20. 11. 2024
Datum podání práce: 7. 12. 2025
Datum obhajoby: 27. 1. 2026
Identifikátor v systému InSIS: https://insis.vse.cz/zp/90433/podrobnosti

Soubory ke stažení

    Poslední aktualizace: