The use of statistical methods for prediction of sport results

Thesis title: Využití statistických metod pro predikci sportovních výsledků
Author: Randuška, Daniel
Thesis type: Bakalářská práce
Supervisor: Fojtík, Jan
Opponents: Rejthar, Jan
Thesis language: Česky
Abstract:
Práce se zabývá tvorbou modelů pro predikci výsledků utkání basketbalové NBA. Za pomoci historických statistik z utkáních a týmového ohodnocení založených na Elo modelu, vytvořené modely určují pravděpodobnost výhry domácích týmů. Pro vytvoření ohodnocení dle Elo modelu byly zvoleny dva postupy. Jedním z nich je převzetí již existující modifikované verze původního modelu. Druhým je vytvoření vlastní modifikace modelu za pomoci simulací, kdy pro výběr optimálních hodnot parametrů modelu sloužilo porovnání středních kvadratických chyb. Následným cílem bylo nalezení optimálního modelu, který by dokázal nejpřesněji určit výhru domácích. Jednotlivé modely se odlišují buď užitím různých variant Elo modelu, či zvolením různých klasifikačních metod. Klasifikační metody, které byly zvoleny pro tuto práci jsou logistická regrese a metoda podpůrných vektorů. Model využívající převzatou modifikaci Elo modelu a logistickou regresi byl vybrán jako nejadekvátnější. Přesnost jeho predikcí se téměř rovná již existujícím modelům.
Keywords: Elo model; Logistická regrese; Metoda podpůrných vektorů; Basketbal; NBA
Thesis title: The use of statistical methods for prediction of sport results
Author: Randuška, Daniel
Thesis type: Bachelor thesis
Supervisor: Fojtík, Jan
Opponents: Rejthar, Jan
Thesis language: Česky
Abstract:
The thesis is focused on the creation of models for predicting the results of NBA basketball games. With the help of historical statistics from the matches and team evaluation based on the Elo model, the created models determine the probability of the home team winning games. There are two ways which have been chosen to create team evaluation based on the Elo model. One of them was the adoption of an already existing modified version of the original model. The second was the creation of the own modification of the model with the help of simulations, where the selection of the optimal values of the model parameters was done by comparing the mean squared errors. The following goal was to find a model that could most accurately determine the probability of the home team winning. The models differ either by using a different modification of the Elo model or by choosing different classification methods. The classification methods chosen for this work are logistic regression and the support vector machines. The model using the adopted modification of the Elo model and logistic regression was chosen as the most adequate. Moreover, the accuracy of its predictions is almost equal to already existing models.
Keywords: Elo model; Logistic regression; Support vector machines; Basketball; NBA

Information about study

Study programme: Kvantitativní metody v ekonomice/Matematické metody v ekonomii
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 10. 3. 2022
Date of submission: 7. 5. 2023
Date of defense: 14. 6. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/82735/podrobnosti

Files for download

    Last update: