Datově řízená predikce výsledků tenisových zápasů a její srovnání se sázkovými kurzy
| Název práce: | Datově řízená predikce výsledků tenisových zápasů a její srovnání se sázkovými kurzy |
|---|---|
| Autor(ka) práce: | Koudelka, Samson |
| Typ práce: | Bakalářská práce |
| Vedoucí práce: | Zimmermann, Pavel |
| Oponenti práce: | Fojtík, Jan |
| Jazyk práce: | Česky |
| Abstrakt: | Tato bakalářská práce se zabývá možnostmi datově řízené predikce výsledků profesionálních tenisových zápasů a jejím porovnáním se sázkovými kurzy vypsanými sázkovými kancelářemi. Hlavním cílem práce je ověřit, zda lze pomocí metod strojového učení vytvářet pravděpodobnostní odhady výsledků zápasů, které poskytují informační výhodu vůči tržním kurzům, a posoudit jejich praktickou využitelnost v oblasti sportovního sázení. Pro analýzu jsou využita historická data o zápasech ATP doplněná o informace o sázkových kurzech. Na jejich základě jsou vytvořeny prediktory popisující výkonnost hráčů, jejich aktuální formu, vzájemné zápasy a herní statistiky z předchozích utkání. Predikční modely jsou realizovány pomocí vybraných metod strojového učení, konkrétně logistické regrese, náhodného lesa, metody podpůrných vektorů (SVM) a algoritmu XGBoost. Kvalita predikcí je hodnocena nejen pomocí klasifikačních metrik, ale především prostřednictvím simulace sázkových strategií založených na pravděpodobnostních odhadech modelů. Výsledky jsou porovnávány s implicitními pravděpodobnostmi vyplývajícími ze sázkových kurzů. Práce ukazuje, že modely v kombinaci se specifickými strategiemi dokážou porážet kurzy sázkových kanceláří na základě výsledků ROI a PnL. |
| Klíčová slova: | tenis; strojové učení; ATP; sázkové kurzy; sázení; logistická regrese; XGBoost; Náhodný les; SVM; Kellyho kritérium; ROI; PnL |
| Název práce: | Data-driven prediction of results of tennis matches and its comparison with betting odds |
|---|---|
| Autor(ka) práce: | Koudelka, Samson |
| Typ práce: | Bachelor thesis |
| Vedoucí práce: | Zimmermann, Pavel |
| Oponenti práce: | Fojtík, Jan |
| Jazyk práce: | Česky |
| Abstrakt: | This bachelor thesis deals with the possibility of results predictions in the context of professional tennis matches and its comparison with bookmaker odds. The main goal of the thesis is to verify whether, with the use of machine learning, it is possible to create probability estimates of the match results that give informational advantage compared to the bookmaker odds and to assess their practical use within the context of sports betting. The analysis uses historical data about ATP matches supplemented by information about the betting odds. Based on them are created predictors, describing the performance of players, their form, head-to-head statistics and any game data from previous matches. The prediction models are used by a few selected methods of machine learning– namely: Logistic Regression, Random Forest, Support Vector machine method and XGBoost algorithm. The quality of the predictions is evaluated not only by classification metrics, but mainly by simulation of betting strategies based on probability predictions of the models. The results are compared with implicit probabilities based on the betting odds. The thesis shows that the models, in combination with specific betting strategies, can beat out odds of betting agencies, based on the results of ROI and PnL. |
| Klíčová slova: | tennis; ATP; betting odds; betting; Logistic Regression; XGBoost; SVM; Kelly criterion; PnL; machine learning; Random Forest; ROI |
Informace o studiu
| Studijní program / obor: | Data Analytics |
|---|---|
| Typ studijního programu: | Bakalářský studijní program |
| Přidělovaná hodnost: | Bc. |
| Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
| Fakulta: | Fakulta informatiky a statistiky |
| Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
| Datum zadání práce: | 25. 3. 2026 |
|---|---|
| Datum podání práce: | 11. 5. 2026 |
| Datum obhajoby: | 15. 6. 2026 |
| Identifikátor v systému InSIS: | https://insis.vse.cz/zp/96175/podrobnosti |