Analysis of winning streaks in the NHL

Thesis title: Analysis of winning streaks in the NHL
Author: Virba, Tomáš
Thesis type: Bachelor thesis
Supervisor: Zouhar, Jan
Opponents: Rejthar, Jan
Thesis language: English
Abstract:
The thesis is devoted to winning streaks in the National Hockey League. Analysis is implemented on the data from all regular-season games beginning in the 2013/14 season until 2018/19. Primary argument is that the investigation is only conducted on regular season statistics to avoid playoff bias. Inquiry revolves around whether a predictive and analytical methodology can accurately forecast the continuation or termination of a winning streak in the NHL. Descriptive statistics is used to find and estimate the factors affecting the continuation of an ongoing winning streak. Application of linear and logistic regression with Fixed effects, Mixed effects, Cross-random effects, and Discrete-time Survival analysis is used to discover possible statistical dependencies between variables and create the most precise predictive models. The results suggest that with a rising number of won matches in the time of streak provided by the team, the probability of losing the next game decreases. A statistically significant difference between the probabilities of losing the next match between long and short winning streaks has been proven by rejecting the hypothesis about the same probabilities over the number of consecutive matches won by the observed team. Models used in the thesis did not provide sufficient prediction rates to beat the odds of bookmakers with an accuracy rate of 56% by the most accurate model provided.
Keywords: analysis; mixed models regression; nhl; predictive modeling; winning streaks
Thesis title: Analysis of winning streaks in the NHL
Author: Virba, Tomáš
Thesis type: Bakalářská práce
Supervisor: Zouhar, Jan
Opponents: Rejthar, Jan
Thesis language: English
Abstract:
Bakalářská práce je věnována vítězným šňůrám v NHL. Analýza je prováděna na datech ze všech zápasů základní části sezón od sezóny 2013/14 do sezóny 2018/19. Hlavní argument spočívá v tom, že analýza se provádí pouze na statistikách základní části, aby se předešlo zkreslení playoff. Studie se zaměřuje na to, zda prediktivní a analytická metodologie dokáže přesně předpovědět pokračování nebo ukončení vítězné šňůry v NHL. Deskriptivní statistika se používá k nalezení a odhadu faktorů ovlivňujících pokračování probíhající vítězné šňůry. Aplikace lineární a logistické regrese s Pevnými efekty, Smíšenými efekty, Křížově náhodnými efekty a Diskrétně-časovou analýzou přežití se používá k objevení možných statistických závislostí mezi proměnnými a vytvoření nejpřesnějších prediktivních modelů. Výsledky naznačují, že s rostoucím počtem vyhraných zápasů v období šňůry týmům klesá pravděpodobnost prohry v dalším zápase. Statisticky významný rozdíl mezi pravděpodobnostmi prohry v dalším zápase mezi dlouhými a krátkými vítěznými šňůrami byl prokázán zamítnutím hypotézy o stejných pravděpodobnostech v průběhu počtu po sobě jdoucích vyhraných zápasů pozorovaným týmem. Modely použité v práci neposkytly dostatečné predikční míry na překonání kurzů sázkových kanceláří s přesností 56% nejpřesněji poskytnutým modelem.
Keywords: prediktivní modelování; vítězné série; analýza; regrese smíšených modelů; nhl

Information about study

Study programme: Matematické metody v ekonomii/Ekonometrie a operační výzkum
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Econometrics

Information on submission and defense

Date of assignment: 9. 3. 2023
Date of submission: 6. 5. 2024
Date of defense: 2024

Files for download

The files will be available after the defense of the thesis.

    Last update: