Predikce výsledků hokejových utkání pomocí data mining modelu
Název práce: | Predikce výsledků hokejových utkání pomocí data mining modelu |
---|---|
Autor(ka) práce: | Matuš, Martin |
Typ práce: | Diplomová práce |
Vedoucí práce: | Maryška, Miloš |
Oponenti práce: | Volavka, Filip |
Jazyk práce: | Česky |
Abstrakt: | V této práci se zaměřuji na tvorbu a porovnání modelu pro predikci výsledků hokejových utkání se specializací na zápasy mistrovství světa v ledním hokeji. V první části se nejprve věnuji shromáždění teoretických znalostí umožňujících takovou úlohu vyřešit a ve druhé části tyto znalosti aplikuji. Postup tvorby modelu se řídí data mining metodologií CRISP-DM, jejíž etapy se promítají i v práci samotné. Jako vstupní data jsou využity údaje o výsledcích jednotlivých hráčů reprezentačních mužstev z ligových ročníků předcházejících danému mistrovství. Tato data se nacházejí na veřejně přístupných internetových zdrojích, tudíž součástí práce je i tvorba a využití automatizovaného skriptu, který tyto zdroje prochází a data agreguje. Získaná data jsou upravena do podoby jednotlivých utkání odehraných na šampionátech (tým A složený z hráčů X proti týmu B složenému z hráčů Y) doplněných o výsledky těchto utkání (výhra domácího týmu, prohra domácího týmu). Poté jsou data analyzována za účelem odhalení možných nedostatků a přípravy hypotéz (popis atributů, volba závislého atributu -- výsledek utkání) a transformována do podoby využitelné data miningovým nástrojem. Hodnocení výsledků se skládá ze dvou částí, v té první hodnotím výsledky jednotlivých modelů jako takových při porovnání klasifikace dat z testovací skupiny na skutečné výsledky zápasů. Zde hodnotím také možnosti nasazení modelu do praxe. Součástí této fáze je i opětovná kontrola správnosti použití atributů vstupujících do analýzy. Ve druhé části dochází k porovnávání dosažených hodnot s údaji o sázkových kurzech -- ověřuje se tak smysluplnost použití takovýchto modelů. Pro tento účel využívám volně dostupné údaje o kurzech, které byly vypsány pro zápasy odpovídající utkáním z testovací množiny dat (kurz na výhru domácích a kurz na výhru hostů). Na závěr je vybraný predikční model nasazen na utkání základních skupin MS v hokeji v roce 2015. |
Klíčová slova: | predikce; hokej; RapidMiner; CRISP-DM; umělé neuronové sítě; data mining |
Název práce: | Ice Hockey Match Prediction Using Data Mining Model |
---|---|
Autor(ka) práce: | Matuš, Martin |
Typ práce: | Diploma thesis |
Vedoucí práce: | Maryška, Miloš |
Oponenti práce: | Volavka, Filip |
Jazyk práce: | Česky |
Abstrakt: | This thesis focuses on creation and comparison of ice hockey matches prediction models with the view on ice hockey world championship matches. The first part is dedicated to collecting theoretical knowledge needed for solving this problem and the second to applying this set of knowledge. The model creation approach is intertwined with the CRISP-DM data mining methodology, which also defines several chapters of this work. As input data for the models I used performance statistics of individual ice hockey players -- this brought me to implementing a script capable of automatic downloading and aggregating of player data from the Internet. Downloaded data were arranged so as they would represent ice hockey matches that were played during the championships (team A consisting of players X against team B consisting of players Y) with result of the match added to the data row. Data were also analyzed to detect any quality issue prior to the model creation and transformed into an integrated view. Result assessment consists of two parts, in the first the technical evaluation of models using data from the testing data set takes place. The first part also points out practical usefulness of the models. The next part is about comparing result data with the betting odds -- the business relevance of the model. This part uses open source data about betting odds listed on the corresponding matches. Finally, the outcome model is used for predicting matches of the group phase of the world championship taking place in Prague, 2015. |
Klíčová slova: | artificial neural networks; prediction; CRISP-DM; ice hockey; data mining; RapidMiner |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 12. 12. 2014 |
---|---|
Datum podání práce: | 7. 5. 2015 |
Datum obhajoby: | 29. 5. 2015 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/50594/podrobnosti |