Závěrečná práce - Institut celoživotního vzdělávání
Vedoucí práce:
Potančok, Martin
Oponenti práce:
Karel, Tomáš
Jazyk práce:
Česky
Abstrakt:
Práce se zabývá vývojem analytického nástroje pro identifikaci neefektivit na politických sázkových trzích prostřednictvím integrace a analýzy více datových zdrojů. Navržené řešení kombinuje agregované volební průzkumy zpracované metodou poll of polls s exponenciálním časovým vážením, sázkové kurzy získávané automatizovaným scrapingem, data vyhledávacího zájmu z Google Trends a data mediálního pokrytí. Pro kvantifikaci nejistoty predikcí je implementována metoda Monte Carlo. Vizualizační rozhraní realizované v knihovně Streamlit umožňuje interaktivní analýzu a identifikaci sázkových příležitostí. Validace proběhla na datech z voleb do Poslanecké sněmovny ČR v říjnu 2025. Model dosáhl střední absolutní chyby 1,76 procentního bodu a překonal přesností tři z pěti porovnávaných průzkumných agentur. Většina identifikovaných sázkových příležitostí byla úspěšná, což potvrzuje přidanou hodnotu integrace více datových zdrojů.
Klíčová slova:
predikční model; datová integrace; politické sázkové trhy; web scraping; poll of polls; Monte Carlo simulace; expected value
Název práce:
Analytical tool for political betting markets
Autor(ka) práce:
Orlický, Jan
Typ práce:
Závěrečná práce - Institut celoživotního vzdělávání
Vedoucí práce:
Potančok, Martin
Oponenti práce:
Karel, Tomáš
Jazyk práce:
Česky
Abstrakt:
This thesis focuses on the development of an analytical tool for identifying inefficiencies in political betting markets through integration and analysis of multiple data sources. The proposed solution combines aggregated election polls processed using the poll of polls method with exponential time weighting, betting odds obtained through automated scraping, search interest data from Google Trends, and media coverage data. Monte Carlo simulation is implemented for uncertainty quantification. The visualization interface built with Streamlit enables interactive analysis and identification of betting opportunities. The tool was validated using data from the Czech parliamentary elections in October 2025. The model achieved a mean absolute error of 1.76 percentage points, outperforming three out of five polling agencies. The majority of identified betting opportunities proved successful, confirming the added value of integrating multiple data sources.
Klíčová slova:
web scraping; political betting markets; predictive model; poll of polls; data integration; Monte Carlo simulation; expected value