Data mining v oblasti kurzového sázení 3. anglické fotbalové ligy

Název práce: Data mining v oblasti kurzového sázení 3. anglické fotbalové ligy
Autor(ka) práce: Faruzel, Jiří
Typ práce: Diplomová práce
Vedoucí práce: Berka, Petr
Oponenti práce: Šimůnek, Milan
Jazyk práce: Česky
Abstrakt:
Diplomová práce "Data mining v oblasti kurzového sázení 3. anglické fotbalové ligy" se zabývá získáváním znalostí z dat souhrnně označovaném pojmem data mining. Cílem této práce je nalézt datové modely pro predikci výsledků zápasů pomocí procedury SD4ft sytému LispMiner a tyto predikce následně porovnat s vybranou strategií sázkaře. Strategie sázkaře je založena na sázení sólo sázek s kurzy, které spadají do vybraných kurzových intervalů přinášejících zisk. Tyto intervaly byly nalezeny analýzou zápasů ze sezon 2006-2009 pomocí simulátoru. Na základě těchto kurzových intervalů byly vytvořeny datové modely. Základem každého datového modelu je právě jedna hypotéza vygenerována procedurou SD4ft ze systému LispMiner na základě zápasů odehraných v sezonách 2001-2008. Nalezené datové modely jsou následně ověřeny na zápasech ze sezon 2006-2009 v simulátoru. Ukázalo se, že všechny datové modely přinesly v uvažovaných čtyřech sezonách zisk. Jejich větší polovina také úspěšně predikovala zápasy v sezoně 2009. Z analýzy také vyplynulo, že sázkové kanceláře ve většině případů vypisují kurzy, které sázkařům sázejícím podle výše kurzů nemohou vytvořit zisk. Navzdory tomu se mi podařilo identifikovat množství kurzových intervalů, s jejichž pomocí lze uspět při sázení jednoduchých sázek na výhru domácích, remízu či výhru hostů s kurzy spadajícími do těchto intervalů. Asociace s vysokou spolehlivostí a podporou umožňují dosáhnout relativně vysokého zisku. Je důležité si uvědomit, že žádné z nalezených datových modelů nezaručují jistotu zisku. Většina modelů není použitelná v praxi, některé z nich navíc mohou způsobit vysokou finanční ztrátu. I přesto lze nalézt modely, které přinášejí zisk i v reálných podmínkách.
Klíčová slova: Asociace s vysokou spolehlivostí a podporou umožňují dosáhnout relativně vysokého zisku; Data mining v oblasti kurzového sázení 3. anglické fotbalové ligy; Predikce výsledků zápasů pomocí procedury SD4ft sytému LispMiner
Název práce: Data Mining in the Field of English Football League Third Division's Betting Odds
Autor(ka) práce: Faruzel, Jiří
Typ práce: Diploma thesis
Vedoucí práce: Berka, Petr
Oponenti práce: Šimůnek, Milan
Jazyk práce: Česky
Abstrakt:
Thesis "Data Mining in the Field of English Football League Third Division's Betting Odds" deals with data mining referring to acquiring knowledge from data. The main objective of this work is to develop data models for prediction of match results and to compare these predictions with a chosen strategy of betting. The selected betting strategy is based on betting single bets with odds belonging to chosen intervals, which generate a profit. These odds intervals were discovered by analyzing 2006-2009 football matches in a created simulator. On the basis of these odds ranges data models were constructed. Each data model contains a hypothesis which is generated by SD4ft procedure of LispMiner based on all football matches played in seasons 2001-2008. Developed data models are tested afterwards using 2006-2009 football matches data. Results show that all derived data models are profitable in all four seasons under consideration. More than half of them successfully predicted 2009 matches as well. The analysis showed that betting agencies offer mostly odds which make it almost impossible to be profitable while betting on matches according to their odds. In spite of this fact I identified some odds intervals with which you can success while betting single bets on home-team, draw or visitor-team with odds falling within these intervals. Association rules with reasonable confidence and support can generate high profitability. It is important to realize that there are no data models which guarantee a certain profit. Most of developed data models are not applicable in the real world, some of them can actually generate a loss. Nevertheless there are data models to be found that could generate a profit in the real world.
Klíčová slova: Association rules with reasonable confidence and support can generate high profitability; Model contains a hypothesis which is generated by SD4ft procedure of LispMiner; Data Mining in the Field of English Football League Third Division's Betting Odds

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 3. 11. 2009
Datum podání práce: 5. 5. 2010
Datum obhajoby: 10. 2. 2011
Identifikátor v systému InSIS: https://insis.vse.cz/zp/22611/podrobnosti

Soubory ke stažení

    Poslední aktualizace: