Ice Hockey Match Prediction Using Data Mining Model

Thesis title: Predikce výsledků hokejových utkání pomocí data mining modelu
Author: Matuš, Martin
Thesis type: Diplomová práce
Supervisor: Maryška, Miloš
Opponents: Volavka, Filip
Thesis language: Česky
Abstract:
V této práci se zaměřuji na tvorbu a porovnání modelu pro predikci výsledků hokejových utkání se specializací na zápasy mistrovství světa v ledním hokeji. V první části se nejprve věnuji shromáždění teoretických znalostí umožňujících takovou úlohu vyřešit a ve druhé části tyto znalosti aplikuji. Postup tvorby modelu se řídí data mining metodologií CRISP-DM, jejíž etapy se promítají i v práci samotné. Jako vstupní data jsou využity údaje o výsledcích jednotlivých hráčů reprezentačních mužstev z ligových ročníků předcházejících danému mistrovství. Tato data se nacházejí na veřejně přístupných internetových zdrojích, tudíž součástí práce je i tvorba a využití automatizovaného skriptu, který tyto zdroje prochází a data agreguje. Získaná data jsou upravena do podoby jednotlivých utkání odehraných na šampionátech (tým A složený z hráčů X proti týmu B složenému z hráčů Y) doplněných o výsledky těchto utkání (výhra domácího týmu, prohra domácího týmu). Poté jsou data analyzována za účelem odhalení možných nedostatků a přípravy hypotéz (popis atributů, volba závislého atributu -- výsledek utkání) a transformována do podoby využitelné data miningovým nástrojem. Hodnocení výsledků se skládá ze dvou částí, v té první hodnotím výsledky jednotlivých modelů jako takových při porovnání klasifikace dat z testovací skupiny na skutečné výsledky zápasů. Zde hodnotím také možnosti nasazení modelu do praxe. Součástí této fáze je i opětovná kontrola správnosti použití atributů vstupujících do analýzy. Ve druhé části dochází k porovnávání dosažených hodnot s údaji o sázkových kurzech -- ověřuje se tak smysluplnost použití takovýchto modelů. Pro tento účel využívám volně dostupné údaje o kurzech, které byly vypsány pro zápasy odpovídající utkáním z testovací množiny dat (kurz na výhru domácích a kurz na výhru hostů). Na závěr je vybraný predikční model nasazen na utkání základních skupin MS v hokeji v roce 2015.
Keywords: predikce; hokej; RapidMiner; CRISP-DM; umělé neuronové sítě; data mining
Thesis title: Ice Hockey Match Prediction Using Data Mining Model
Author: Matuš, Martin
Thesis type: Diploma thesis
Supervisor: Maryška, Miloš
Opponents: Volavka, Filip
Thesis language: Česky
Abstract:
This thesis focuses on creation and comparison of ice hockey matches prediction models with the view on ice hockey world championship matches. The first part is dedicated to collecting theoretical knowledge needed for solving this problem and the second to applying this set of knowledge. The model creation approach is intertwined with the CRISP-DM data mining methodology, which also defines several chapters of this work. As input data for the models I used performance statistics of individual ice hockey players -- this brought me to implementing a script capable of automatic downloading and aggregating of player data from the Internet. Downloaded data were arranged so as they would represent ice hockey matches that were played during the championships (team A consisting of players X against team B consisting of players Y) with result of the match added to the data row. Data were also analyzed to detect any quality issue prior to the model creation and transformed into an integrated view. Result assessment consists of two parts, in the first the technical evaluation of models using data from the testing data set takes place. The first part also points out practical usefulness of the models. The next part is about comparing result data with the betting odds -- the business relevance of the model. This part uses open source data about betting odds listed on the corresponding matches. Finally, the outcome model is used for predicting matches of the group phase of the world championship taking place in Prague, 2015.
Keywords: artificial neural networks; prediction; CRISP-DM; ice hockey; data mining; RapidMiner

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 12. 12. 2014
Date of submission: 7. 5. 2015
Date of defense: 29. 5. 2015
Identifier in the InSIS system: https://insis.vse.cz/zp/50594/podrobnosti

Files for download

    Last update: