Application of statistical methods for sports results prediction
Thesis title: | Využití statistických metod pro predikci sportovních výsledků |
---|---|
Author: | Rozmajzl, Matěj |
Thesis type: | Bakalářská práce |
Supervisor: | Fojtík, Jan |
Opponents: | Cibulková, Jana |
Thesis language: | Česky |
Abstract: | Cílem této bakalářské práce je predikovat výsledky nejvyšší anglické fotbalové ligy pomocí multinomické logistické regrese za využití běžně sbíraných dat, jako je počet střel, počet vstřelených branek a počet faulů. První část práce se zabývá charakterem dat a prozkoumání fenoménu výhody domácího prostředí. Poté je modelována Elo metoda jako ukazatel síly celků, která je použitá jako prediktor dále v modelu. Zevrubně jsou také popsány teoretické základy užitých statistických metod s důrazem na stěžejní regresní analýzu. K predikci se využívají dva různé modely, které se navzájem liší přístupem k ratingům týmů. Jeden z modelů jej používá přímo jako prediktor, druhý potom jako váhy pro střely a góly. Práce využívá dvě různé predikční funkce, pro lepší možnost predikování remíz. |
Keywords: | multinomická logistická regrese; predikce; Premier League; Elo metoda; fotbal |
Thesis title: | Application of statistical methods for sports results prediction |
---|---|
Author: | Rozmajzl, Matěj |
Thesis type: | Bachelor thesis |
Supervisor: | Fojtík, Jan |
Opponents: | Cibulková, Jana |
Thesis language: | Česky |
Abstract: | The goal of this bachelor’s thesis is to predict results of the premier English football league using multinomial logistic regression using commonly gathered information as number of shots, number of goals and number of fouls. The first part of thesis is concerned with the characteristics of data and delves into intricacies of the home advantage phenomenon. Afterwards the Elo method is modelled as an indicator of team strength, which is being used as a predictor later. The theoretical basis of statistical methods used in the thesis are described in detail, with extra attention focused on regression analysis. For prediction, two different models are used. They differ in the way they handle ratings. One of the models uses ratings directly as a predictor, while the other only uses them as a weight for shots and goals. The thesis uses two different prediction functions to better predict draws. |
Keywords: | football; Elo method; multinomial logistic regression; prediction; Premier League |
Information about study
Study programme: | Matematické metody v ekonomii/Datové analýzy a modelování |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Statistics and Probability |
Information on submission and defense
Date of assignment: | 10. 3. 2022 |
---|---|
Date of submission: | 8. 5. 2023 |
Date of defense: | 14. 6. 2023 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/82411/podrobnosti |