Use of regression models for assessment of quality of a shot in ice hockey
Thesis title: | Využití regresních modelů pro hodnocení kvality střely v ledním hokeji |
---|---|
Author: | Horák, Tomáš |
Thesis type: | Bakalářská práce |
Supervisor: | Malá, Ivana |
Opponents: | Čabla, Adam |
Thesis language: | Česky |
Abstract: | Práce je zaměřena na analýzu reálných hokejových dat z National Hockey League (NHL) za předchozích 10 dokončených sezon. Data jsou zpracována, upravena a obohacena pro následnou analýzu a tvorbu modelu v programu R. Je provedena analýza závislostí jednotlivých faktorů a toho, zda gól padne, nebo ne. Zároveň je zkoumáno, jaké střely jsou nejnebezpečnější a nejčastěji vedou ke gólů, např. pomocí tzv. heatmap. V další části je pomocí logistické regrese vytvořen a vyhodnocen tzv. expected goals model odhadující pravděpodobnost vstřelení gólu z konkrétní střely. Kvalita a predikční schopnosti sestaveného modelu jsou dobré. Je také provedeno srovnání odhadnutého modelu se čtyřmi dílčími modely pro jednotlivé herní situace. Výsledkem je model, který odhaduje, zda střelec z konkrétní střely skóruje, či nikoliv. |
Keywords: | logistická regrese; Lední hokej; NHL; expected goals model |
Thesis title: | Use of regression models for assessment of quality of a shot in ice hockey |
---|---|
Author: | Horák, Tomáš |
Thesis type: | Bachelor thesis |
Supervisor: | Malá, Ivana |
Opponents: | Čabla, Adam |
Thesis language: | Česky |
Abstract: | The bachelor thesis is focused on analysis of real ice-hockey data from the National Hockey League (NHL) from previous 10 completed seasons. The data are processed, modified and enriched for the purpose of analysis and modelling in software R. Analysis of dependencies between several factors and whether the goal is scored or not is performed. At the same time, it is investigated which shots are most dangerous and most often lead to a goal, e.g. using heatmaps. In the following part, logistic regression is used to create an expected goals model to estimate the probability of scoring a goal from a particular shot. Quality and predictive abilities of the estimated model are good. The model is also compared to four partial models for each game situation. The outcome is a model that estimates whether shooter scores a particular shot or not. |
Keywords: | NHL; expected goals model; logistic regression; Ice hockey |
Information about study
Study programme: | Kvantitativní metody v ekonomice/Statistické metody v ekonomii |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Statistics and Probability |
Information on submission and defense
Date of assignment: | 16. 10. 2018 |
---|---|
Date of submission: | 27. 4. 2019 |
Date of defense: | 13. 6. 2019 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/67394/podrobnosti |