Predikce výsledků zápasů NHL pomocí metod strojového učení

Název práce: Predikce výsledků zápasů NHL pomocí metod strojového učení
Autor(ka) práce: Geryk, Matyáš
Typ práce: Bakalářská práce
Vedoucí práce: Sokol, Ondřej
Oponenti práce: Vávra, Vojtěch
Jazyk práce: Česky
Abstrakt:
Vzhledem ke kontinuální povaze ledního hokeje a vysokému podílu náhody představuje prediktivní modelování výsledků zápasů kanadsko-americké NHL specifickou analytickou výzvu. Hlavním cílem práce je navrhnout, natrénovat a optimalizovat modely strojového učení, které budou schopné s co nejvyšší přesností predikovat výhru domácích či hostů a následně ověřit využitelnost vítězného algoritmu v simulovaném sázkovém prostředí. Vstupní dataset pokrývající ročníky 2019/20 až 2024/25 byl extrahován z oficiálního NHL API. Z původní široké sady dat obohacené o systém hodnocení Elo byla pomocí korelační matice a výběrových algoritmů definována finální sada 35 klíčových prediktorů. V rámci experimentů byly porovnány modely logistické regrese, Random Forest, XGBoost a neuronové sítě. Jako nejlepší se v tomto prostředí ukázala logistická regrese. Ta na neviděných datech testovací sezóny dosáhla přesnosti 60,60 %, čímž překonala srovnávací základnu. Praktický potenciál vítězného modelu nakonec potvrdila sázková simulace řízená defenzivním Kellyho kritériem, ve které algoritmus dosáhl návratnosti investic ve výši 30,75 %.
Klíčová slova: strojové učení; NHL; sportovní predikce; logistická regrese; lední hokej
Název práce: Prediction of NHL Game Outcomes Using Machine Learning Methods
Autor(ka) práce: Geryk, Matyáš
Typ práce: Bachelor thesis
Vedoucí práce: Sokol, Ondřej
Oponenti práce: Vávra, Vojtěch
Jazyk práce: Česky
Abstrakt:
Due to the continuous nature of ice hockey and a high degree of randomness, predictive modeling of NHL game outcomes presents a specific analytical challenge. The main objective of the thesis is to design, train, and optimize machine learning models capable of predicting home or away wins with the highest possible accuracy, and subsequently verify the practical applicability of the winning algorithm in a simulated betting environment. The input dataset covering the 2019/20 to 2024/25 seasons was extracted from the official NHL API. From the original broad dataset enriched with the Elo rating system, a final set of 35 key predictors was defined using a correlation matrix and feature selection algorithms. Within the scope of the experiments, Logistic Regression, Random Forest, XGBoost, and neural network models were compared. Logistic Regression emerged as the most robust model in this environment. It achieved an accuracy of 60.60 % on unseen data from the test season, thereby successfully outperforming the comparative baseline. Finally, the practical potential of the winning model was confirmed by a betting simulation guided by a defensive Kelly criterion, in which the algorithm achieved a return on investment of 30.75 %.
Klíčová slova: sport prediction; ice hockey; machine learning; logistic regression; NHL

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra ekonometrie

Informace o odevzdání a obhajobě

Datum zadání práce: 27. 11. 2025
Datum podání práce: 11. 5. 2026
Datum obhajoby: 26. 6. 2026
Identifikátor v systému InSIS: https://insis.vse.cz/zp/94694/podrobnosti

Soubory ke stažení

    Poslední aktualizace: