Data mining on betting odds data of football matches
Thesis title: | Data mining na datech o sázkových kurzech na fotbalová utkání |
---|---|
Author: | Vavruška, Vladimír |
Thesis type: | Bakalářská práce |
Supervisor: | Rauch, Jan |
Opponents: | Máša, Petr |
Thesis language: | Česky |
Abstract: | Bakalářská práce se zabývá využitím data miningu na datech o sázkových kurzech na utkání 1. české fotbalové ligy od sezóny 2016/2017 do sezóny 2022/2023. Vzhledem k velmi rozsáhlým datům z předchozích let můžeme pomocí technik data miningu predikovat nejlepší možnou sázku s cílem zisku. Teoretická část se zaměřuje na metodiku CRISP-DM, která zahrnuje fáze porozumění doménové oblasti, porozumění datům, předzpracování dat, modelování, vyhodnocení a využití výsledků. Podle této metodiky je strukturována praktická část práce. Dále je součástí teoretické části představení systému LISp-Miner ve kterém se bude analýza zpracovávat. V praktické části práce jsou použity kroky data miningu na vybraných datech od získání dat po interpretaci výsledků analýzy. Modelování je realizováno v prostředí LISp-Miner pomocí procedur 4ft-Miner, CF-Miner a SD4ft-Miner, které jsou použity k řešení připravených analytických otázek. Výsledky analytických otázek jsou zobrazeny a dále analyzovány v systému MS Office Excel. Hlavním cílem práce je zjištění dlouhodobých trendů sázkových kurzů a nalezení podhodnocených sázek za účelem výdělku. |
Keywords: | data mining; dobývání znalostí z databází; LISp-Miner; sázkové kurzy; 1. česká fotbalová liga |
Thesis title: | Data mining on betting odds data of football matches |
---|---|
Author: | Vavruška, Vladimír |
Thesis type: | Bachelor thesis |
Supervisor: | Rauch, Jan |
Opponents: | Máša, Petr |
Thesis language: | Česky |
Abstract: | This bachelor's thesis examines the use of data mining techniques on betting odds of football matches in the Czech First League spanning from the 2016/2017 season to the 2022/2023 season. Given the very extensive data from previous years, we can use data mining techniques to predict the best possible bets with the goal of profit. The theoretical part focuses on the CRISP-DM methodology, which includes the phrases of problem understanding, data understanding, data preparation, modeling, evaluation, and deployment of results. The practical part is structured by this methodology. The introduction of LISp-Miner system is also included in the theoretical part. In the practical part of the work, data mining steps are used on selected data from data acquisition to interpretation of analysis results. Modeling is implemented in LISp-Miner environment, using 4ft-Miner, CF-Miner and SD4ft-Miner procedures, which are used to solve predefined analytical questions. The results of the analysis are then displayed and further analyzed in the MS Office Excel system. The main goal is to find long-term trends in betting odds and to find ideal bets for generating profit. |
Keywords: | data mining; knowledge extraction from databases; LISp-Miner; betting odds; Czech First League |
Information about study
Study programme: | Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 21. 12. 2023 |
---|---|
Date of submission: | 5. 5. 2024 |
Date of defense: | 14. 6. 2024 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/86947/podrobnosti |