Data Mining in the Field of English Football League Third Division's Betting Odds

Thesis title: Data mining v oblasti kurzového sázení 3. anglické fotbalové ligy
Author: Faruzel, Jiří
Thesis type: Diplomová práce
Supervisor: Berka, Petr
Opponents: Šimůnek, Milan
Thesis language: Česky
Abstract:
Diplomová práce "Data mining v oblasti kurzového sázení 3. anglické fotbalové ligy" se zabývá získáváním znalostí z dat souhrnně označovaném pojmem data mining. Cílem této práce je nalézt datové modely pro predikci výsledků zápasů pomocí procedury SD4ft sytému LispMiner a tyto predikce následně porovnat s vybranou strategií sázkaře. Strategie sázkaře je založena na sázení sólo sázek s kurzy, které spadají do vybraných kurzových intervalů přinášejících zisk. Tyto intervaly byly nalezeny analýzou zápasů ze sezon 2006-2009 pomocí simulátoru. Na základě těchto kurzových intervalů byly vytvořeny datové modely. Základem každého datového modelu je právě jedna hypotéza vygenerována procedurou SD4ft ze systému LispMiner na základě zápasů odehraných v sezonách 2001-2008. Nalezené datové modely jsou následně ověřeny na zápasech ze sezon 2006-2009 v simulátoru. Ukázalo se, že všechny datové modely přinesly v uvažovaných čtyřech sezonách zisk. Jejich větší polovina také úspěšně predikovala zápasy v sezoně 2009. Z analýzy také vyplynulo, že sázkové kanceláře ve většině případů vypisují kurzy, které sázkařům sázejícím podle výše kurzů nemohou vytvořit zisk. Navzdory tomu se mi podařilo identifikovat množství kurzových intervalů, s jejichž pomocí lze uspět při sázení jednoduchých sázek na výhru domácích, remízu či výhru hostů s kurzy spadajícími do těchto intervalů. Asociace s vysokou spolehlivostí a podporou umožňují dosáhnout relativně vysokého zisku. Je důležité si uvědomit, že žádné z nalezených datových modelů nezaručují jistotu zisku. Většina modelů není použitelná v praxi, některé z nich navíc mohou způsobit vysokou finanční ztrátu. I přesto lze nalézt modely, které přinášejí zisk i v reálných podmínkách.
Keywords: Asociace s vysokou spolehlivostí a podporou umožňují dosáhnout relativně vysokého zisku; Data mining v oblasti kurzového sázení 3. anglické fotbalové ligy; Predikce výsledků zápasů pomocí procedury SD4ft sytému LispMiner
Thesis title: Data Mining in the Field of English Football League Third Division's Betting Odds
Author: Faruzel, Jiří
Thesis type: Diploma thesis
Supervisor: Berka, Petr
Opponents: Šimůnek, Milan
Thesis language: Česky
Abstract:
Thesis "Data Mining in the Field of English Football League Third Division's Betting Odds" deals with data mining referring to acquiring knowledge from data. The main objective of this work is to develop data models for prediction of match results and to compare these predictions with a chosen strategy of betting. The selected betting strategy is based on betting single bets with odds belonging to chosen intervals, which generate a profit. These odds intervals were discovered by analyzing 2006-2009 football matches in a created simulator. On the basis of these odds ranges data models were constructed. Each data model contains a hypothesis which is generated by SD4ft procedure of LispMiner based on all football matches played in seasons 2001-2008. Developed data models are tested afterwards using 2006-2009 football matches data. Results show that all derived data models are profitable in all four seasons under consideration. More than half of them successfully predicted 2009 matches as well. The analysis showed that betting agencies offer mostly odds which make it almost impossible to be profitable while betting on matches according to their odds. In spite of this fact I identified some odds intervals with which you can success while betting single bets on home-team, draw or visitor-team with odds falling within these intervals. Association rules with reasonable confidence and support can generate high profitability. It is important to realize that there are no data models which guarantee a certain profit. Most of developed data models are not applicable in the real world, some of them can actually generate a loss. Nevertheless there are data models to be found that could generate a profit in the real world.
Keywords: Association rules with reasonable confidence and support can generate high profitability; Model contains a hypothesis which is generated by SD4ft procedure of LispMiner; Data Mining in the Field of English Football League Third Division's Betting Odds

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 3. 11. 2009
Date of submission: 5. 5. 2010
Date of defense: 10. 2. 2011
Identifier in the InSIS system: https://insis.vse.cz/zp/22611/podrobnosti

Files for download

    Last update: