Data mining on betting odds data of football matches

Thesis title: Data mining na datech o sázkových kurzech na fotbalová utkání
Author: Vavruška, Vladimír
Thesis type: Bakalářská práce
Supervisor: Rauch, Jan
Opponents: Máša, Petr
Thesis language: Česky
Abstract:
Bakalářská práce se zabývá využitím data miningu na datech o sázkových kurzech na utkání 1. české fotbalové ligy od sezóny 2016/2017 do sezóny 2022/2023. Vzhledem k velmi rozsáhlým datům z předchozích let můžeme pomocí technik data miningu predikovat nejlepší možnou sázku s cílem zisku. Teoretická část se zaměřuje na metodiku CRISP-DM, která zahrnuje fáze porozumění doménové oblasti, porozumění datům, předzpracování dat, modelování, vyhodnocení a využití výsledků. Podle této metodiky je strukturována praktická část práce. Dále je součástí teoretické části představení systému LISp-Miner ve kterém se bude analýza zpracovávat. V praktické části práce jsou použity kroky data miningu na vybraných datech od získání dat po interpretaci výsledků analýzy. Modelování je realizováno v prostředí LISp-Miner pomocí procedur 4ft-Miner, CF-Miner a SD4ft-Miner, které jsou použity k řešení připravených analytických otázek. Výsledky analytických otázek jsou zobrazeny a dále analyzovány v systému MS Office Excel. Hlavním cílem práce je zjištění dlouhodobých trendů sázkových kurzů a nalezení podhodnocených sázek za účelem výdělku.
Keywords: data mining; dobývání znalostí z databází; LISp-Miner; sázkové kurzy; 1. česká fotbalová liga
Thesis title: Data mining on betting odds data of football matches
Author: Vavruška, Vladimír
Thesis type: Bachelor thesis
Supervisor: Rauch, Jan
Opponents: Máša, Petr
Thesis language: Česky
Abstract:
This bachelor's thesis examines the use of data mining techniques on betting odds of football matches in the Czech First League spanning from the 2016/2017 season to the 2022/2023 season. Given the very extensive data from previous years, we can use data mining techniques to predict the best possible bets with the goal of profit. The theoretical part focuses on the CRISP-DM methodology, which includes the phrases of problem understanding, data understanding, data preparation, modeling, evaluation, and deployment of results. The practical part is structured by this methodology. The introduction of LISp-Miner system is also included in the theoretical part. In the practical part of the work, data mining steps are used on selected data from data acquisition to interpretation of analysis results. Modeling is implemented in LISp-Miner environment, using 4ft-Miner, CF-Miner and SD4ft-Miner procedures, which are used to solve predefined analytical questions. The results of the analysis are then displayed and further analyzed in the MS Office Excel system. The main goal is to find long-term trends in betting odds and to find ideal bets for generating profit.
Keywords: data mining; knowledge extraction from databases; LISp-Miner; betting odds; Czech First League

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 21. 12. 2023
Date of submission: 5. 5. 2024
Date of defense: 14. 6. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/86947/podrobnosti

Files for download

    Last update: