Data and Sport - The Specifics of using Data Mining in Sports

Thesis title: Data a Sport – Specifika využití Data Miningových metod ve sportu
Author: Palatínus, Vojtěch
Thesis type: Diplomová práce
Supervisor: Maryška, Miloš
Opponents: Sládek, Pavel
Thesis language: Česky
Abstract:
Práce se zabývá využitím data miningových technik ve sportovním odvětví. Zaměřuje se především na to, jak mohou v dnešní době statistické údaje hráčů pomoci majitelům, skautům, trenérům, případně dalšímu zodpovědnému personálu. Tedy jejich využití v různých sportovních situacích, ať už za cílem dosažení co největších sportovních úspěchů, tak také z hlediska finančního. Zabývá se tedy analýzou data miningového oboru v rámci sportu. Po představení tradičních data miningových technik se práce soustřeďuje na specifika data minigu sportovních údajů. Popisuje, proč se v jednotlivých sportech sbírají právě dané statistiky, jejich historii, a především využití v různých situacích. Zejména se dotýká témat skautingu, podpoře rozhodování v herních situacích, zdravotního stavu hráčů a predikce, ať už hráčských, tak týmových statistik. Zaměřuje se tedy na analýzu sportovního prostředí vzhledem k práci s daty. Samotné příklady pak demonstruje na hře baseballu, která je nabitá volně dostupnými statistickými informacemi, a tedy vhodná pro demonstraci v akademickém prostředí. Na reálných datech tohoto sportu je pak vypracována data miningová úloha, která je následně interpretována pro čtenáře. Přibližující mu využití data miningu v reálných sportovních situacích, tedy jak se dá s takovými daty naložit, jsou-li správně interpretována. Závěr sleduje stav splnění cílů a zmiňuje možnosti dalšího možného výzkumu v této oblasti.
Keywords: sport data mining; klasifikace; predikce; baseball; data mining
Thesis title: Data and Sport - The Specifics of using Data Mining in Sports
Author: Palatínus, Vojtěch
Thesis type: Diploma thesis
Supervisor: Maryška, Miloš
Opponents: Sládek, Pavel
Thesis language: Česky
Abstract:
The thesis focuses on how to use data mining techniques in sports. Its main focus being on how, in today’s climate, statistical data of players can help owners, scouts, managers and other responsible personnel with their choosing of said players to achieve their goals, being it achievements in results and trophies or a financial one. After presenting traditional data mining techniques, the thesis shifts its focus on the specifics of sports data mining. Describing, why certain data are recorded, their history and most importantly their usage in real life situations. Specifically, regarding scouting reports, decision making in gaming situations, players health and prediction of player or team performance. The thesis focuses on analysis of sports research field in regard to working with data. The examples of the usage of the data are demonstrated on the game of baseball, which is filled with open sourced statistical information’s and therefore suited for the demonstration on the academic field. Using real data from the sport of baseball, the data mining task is performed, which is then interpreted for the reader. It explains the usage of data mining in real sports situations, specifically how to use thus obtained data. In the conclusion, the fulfilment of the thesis goals is debated and the possibility of further research is presented.
Keywords: prediction; baseball; data mining; sport data mining; classification

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 10. 9. 2020
Date of submission: 3. 5. 2021
Date of defense: 4. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/74954/podrobnosti

Files for download

    Last update: