The use of statistical methods for prediction of sport results

Thesis title: Využitie štatistických metód pre predikciu športových výsledkov
Author: Bogdan, Adam
Thesis type: Bachelor thesis
Supervisor: Fojtík, Jan
Opponents: Rejthar, Jan
Thesis language: Slovensky
Abstract:
Bakalárska práca je zameraná na tvorbu modelov pre predikciu futbalových zápasov anglickej Premiere League. Cieľom práce je zistiť presnosť jednotlivých modelov, ktorá je hodnotená na základe výsledkov krížovej entropie ana základe podielu správne predpovedaných zápasov. Následne je vybraný najlepší z nich. Použité modely zahŕňajú využitie Poissonovho rozdelenia, ktoré je dôsledne overené na historických dátach a hodnotenia Elo, pôvodne vytvoreného pre účely šachu. Optimálne hodnoty koeficientu rozvoja v modeli Elo sú získané pomocou simulácií. Modely sú upravené za účelom zohľadnenia výhody domáceho tímu, čomu je venovaná jedna kapitola. Je zistené, že odohraté zápasy bez fanúšikov počas pandémie COVID-19 vykazovali výrazne slabší vplyv výhody domáceho prostredia ako pred pandémiou. Pri výbere optimálnych hodnôt premenných sa model Elo ukázal ako najpresnejší. Zásadné zistenie je, že ani jeden z modelov nedokáže spoľahlivo predpovedať remízu.
Keywords: krížová entropia; futbal; regresia; Poissonovo rozdelenie; Elo model
Thesis title: Využití statistických metod pro predikci sportovních výsledků
Author: Bogdan, Adam
Thesis type: Bakalářská práce
Supervisor: Fojtík, Jan
Opponents: Rejthar, Jan
Thesis language: Slovensky
Abstract:
Bakalářská práce je zaměřena na tvorbu modelů pro predikci fotbalových zápasů anglické Premiere League. Cílem práce je zjistit přesnost jednotlivých modelů, která je hodnocena na základě výsledků křížové entropie a na základě podílu správně předpovězených zápasů. Následně je vybrán nejlepší z nich. Použité modely zahrnují využití Poissonova rozdělení, které je důsledně ověřeno na historických datech a hodnocení Elo, původně vytvořeného pro účely šachu. Optimální hodnoty koeficientu rozvoje v modelu Elo jsou získány pomocí simulací. Modely jsou upraveny za účelem zohlednění výhody domácího týmu, čemuž je věnována jedna kapitola. Je zjištěno, že odehrané zápasy bez fanoušků během pandemie COVID-19 vykazovaly výrazně slabší vliv výhody domácího prostředí než před pandemií. Při výběru optimálních hodnot proměnných se model Elo ukázal jako nejpřesnější. Zásadní zjištění je, že ani jeden z modelů nedokáže spolehlivě předpovědět remízu.
Keywords: Poissonovo rozdělení; Elo model; křížová entropie; fotbal; regrese
Thesis title: The use of statistical methods for prediction of sport results
Author: Bogdan, Adam
Thesis type: Bachelor thesis
Supervisor: Fojtík, Jan
Opponents: Rejthar, Jan
Thesis language: Slovensky
Abstract:
The bachelor thesis presents several prediction models of football matches of the English Premiere league. The aim of the work is to determine the accuracy of individual models based on the resutls of cross-entropy and based on the ratio of correctly predicted matches. Implemented models include the use of Poisson distribution, whose presence is evaluated on historical data and Elo ratings, originally created for use in chess. Optimal values of k-factor in Elo model are obtained using simulation. All models were adjusted to account for advantage of home team which is discussed in a separate chapter. Results prove that matches without fans played during COVID-19 pandemic showed significantly lower signs of home advantage then before pandemic. While optimal parameters are chosen, the Elo model is determined to be the best. A crucial discovery is that neither of the models is sufficient in predicting draws.
Keywords: Elo model; cross-entropy; football; regression; Poisson distribution

Information about study

Study programme: Kvantitativní metody v ekonomice/Matematické metody v ekonomii
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 10. 3. 2022
Date of submission: 9. 5. 2022
Date of defense: 22. 6. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/80198/podrobnosti

Files for download

    Last update: