Use of regression models for assessment of quality of a shot in ice hockey

Thesis title: Využití regresních modelů pro hodnocení kvality střely v ledním hokeji
Author: Horák, Tomáš
Thesis type: Bakalářská práce
Supervisor: Malá, Ivana
Opponents: Čabla, Adam
Thesis language: Česky
Abstract:
Práce je zaměřena na analýzu reálných hokejových dat z National Hockey League (NHL) za předchozích 10 dokončených sezon. Data jsou zpracována, upravena a obohacena pro následnou analýzu a tvorbu modelu v programu R. Je provedena analýza závislostí jednotlivých faktorů a toho, zda gól padne, nebo ne. Zároveň je zkoumáno, jaké střely jsou nejnebezpečnější a nejčastěji vedou ke gólů, např. pomocí tzv. heatmap. V další části je pomocí logistické regrese vytvořen a vyhodnocen tzv. expected goals model odhadující pravděpodobnost vstřelení gólu z konkrétní střely. Kvalita a predikční schopnosti sestaveného modelu jsou dobré. Je také provedeno srovnání odhadnutého modelu se čtyřmi dílčími modely pro jednotlivé herní situace. Výsledkem je model, který odhaduje, zda střelec z konkrétní střely skóruje, či nikoliv.
Keywords: logistická regrese; Lední hokej; NHL; expected goals model
Thesis title: Use of regression models for assessment of quality of a shot in ice hockey
Author: Horák, Tomáš
Thesis type: Bachelor thesis
Supervisor: Malá, Ivana
Opponents: Čabla, Adam
Thesis language: Česky
Abstract:
The bachelor thesis is focused on analysis of real ice-hockey data from the National Hockey League (NHL) from previous 10 completed seasons. The data are processed, modified and enriched for the purpose of analysis and modelling in software R. Analysis of dependencies between several factors and whether the goal is scored or not is performed. At the same time, it is investigated which shots are most dangerous and most often lead to a goal, e.g. using heatmaps. In the following part, logistic regression is used to create an expected goals model to estimate the probability of scoring a goal from a particular shot. Quality and predictive abilities of the estimated model are good. The model is also compared to four partial models for each game situation. The outcome is a model that estimates whether shooter scores a particular shot or not.
Keywords: NHL; expected goals model; logistic regression; Ice hockey

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistické metody v ekonomii
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 16. 10. 2018
Date of submission: 27. 4. 2019
Date of defense: 13. 6. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/67394/podrobnosti

Files for download

    Last update: