Datově řízená predikce výsledků tenisových zápasů a její srovnání se sázkovými kurzy

Název práce: Datově řízená predikce výsledků tenisových zápasů a její srovnání se sázkovými kurzy
Autor(ka) práce: Koudelka, Samson
Typ práce: Bakalářská práce
Vedoucí práce: Zimmermann, Pavel
Oponenti práce: Fojtík, Jan
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zabývá možnostmi datově řízené predikce výsledků profesionálních tenisových zápasů a jejím porovnáním se sázkovými kurzy vypsanými sázkovými kancelářemi. Hlavním cílem práce je ověřit, zda lze pomocí metod strojového učení vytvářet pravděpodobnostní odhady výsledků zápasů, které poskytují informační výhodu vůči tržním kurzům, a posoudit jejich praktickou využitelnost v oblasti sportovního sázení. Pro analýzu jsou využita historická data o zápasech ATP doplněná o informace o sázkových kurzech. Na jejich základě jsou vytvořeny prediktory popisující výkonnost hráčů, jejich aktuální formu, vzájemné zápasy a herní statistiky z předchozích utkání. Predikční modely jsou realizovány pomocí vybraných metod strojového učení, konkrétně logistické regrese, náhodného lesa, metody podpůrných vektorů (SVM) a algoritmu XGBoost. Kvalita predikcí je hodnocena nejen pomocí klasifikačních metrik, ale především prostřednictvím simulace sázkových strategií založených na pravděpodobnostních odhadech modelů. Výsledky jsou porovnávány s implicitními pravděpodobnostmi vyplývajícími ze sázkových kurzů. Práce ukazuje, že modely v kombinaci se specifickými strategiemi dokážou porážet kurzy sázkových kanceláří na základě výsledků ROI a PnL.
Klíčová slova: tenis; strojové učení; ATP; sázkové kurzy; sázení; logistická regrese; XGBoost; Náhodný les; SVM; Kellyho kritérium; ROI; PnL
Název práce: Data-driven prediction of results of tennis matches and its comparison with betting odds
Autor(ka) práce: Koudelka, Samson
Typ práce: Bachelor thesis
Vedoucí práce: Zimmermann, Pavel
Oponenti práce: Fojtík, Jan
Jazyk práce: Česky
Abstrakt:
This bachelor thesis deals with the possibility of results predictions in the context of professional tennis matches and its comparison with bookmaker odds. The main goal of the thesis is to verify whether, with the use of machine learning, it is possible to create probability estimates of the match results that give informational advantage compared to the bookmaker odds and to assess their practical use within the context of sports betting. The analysis uses historical data about ATP matches supplemented by information about the betting odds. Based on them are created predictors, describing the performance of players, their form, head-to-head statistics and any game data from previous matches. The prediction models are used by a few selected methods of machine learning– namely: Logistic Regression, Random Forest, Support Vector machine method and XGBoost algorithm. The quality of the predictions is evaluated not only by classification metrics, but mainly by simulation of betting strategies based on probability predictions of the models. The results are compared with implicit probabilities based on the betting odds. The thesis shows that the models, in combination with specific betting strategies, can beat out odds of betting agencies, based on the results of ROI and PnL.
Klíčová slova: tennis; ATP; betting odds; betting; Logistic Regression; XGBoost; SVM; Kelly criterion; PnL; machine learning; Random Forest; ROI

Informace o studiu

Studijní program / obor: Data Analytics
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 25. 3. 2026
Datum podání práce: 11. 5. 2026
Datum obhajoby: 15. 6. 2026
Identifikátor v systému InSIS: https://insis.vse.cz/zp/96175/podrobnosti

Soubory ke stažení

    Poslední aktualizace: