Modelování síly beachvolejbalových týmů na základě dat z olympijských her
Autor(ka) práce:
Dvořáček, Michal
Typ práce:
Bakalářská práce
Vedoucí práce:
Zouhar, Jan
Oponenti práce:
Sokol, Ondřej
Jazyk práce:
Česky
Abstrakt:
Bakalářská práce se zaměřuje na získání, úpravu a předzpracování a modelování bodových dat z mužského beachvolejbalového turnaje na olympijských hrách. K analýze bodových dat ze všech zápasů jsou využity metody exploratorní analýzy, ratingové modely a regresní přístupy. Klíčovým přínosem je návrh a implementace point-by-point varianty Elo modelu s dynamickým K-faktorem, která umožňuje sledovat vývoj výkonnosti týmů v čase. Vedle toho jsou využity logistické regresní modely, které vysvětlují pravděpodobnost zisku bodu na základě přítomnosti konkrétních týmů, vývoje skóre a kontextu zápasu. Práce se rovněž zabývá omezeními spojenými s kvalitou dostupných dat a s proměnlivostí pořadí týmů v průběhu turnaje. V závěru jsou obě modelové strategie porovnány z hlediska jejich výpovědní schopnosti, interpretovatelnosti a praktické využitelnosti v oblasti sportovní analytiky, přičemž jsou diskutovány i možnosti jejich dalšího rozšíření.
Klíčová slova:
modelování výkonu; sportovní analýza; Elo; beachvolejbal; statistické modelování
Název práce:
Modelling the Strength of Beach Volleyball Teams Based on Data from the Olympic Games
Autor(ka) práce:
Dvořáček, Michal
Typ práce:
Bachelor thesis
Vedoucí práce:
Zouhar, Jan
Oponenti práce:
Sokol, Ondřej
Jazyk práce:
Česky
Abstrakt:
This bachelor's thesis focuses on scraping, preprocessing, engineering, and modelling of point-by-point data from the men's beach volleyball tournament at the Olympic Games. To analyse point data from all matches, exploratory analysis methods, rating models, and regression approaches are employed. A key contribution is designing and implementing a point-by-point variant of the Elo model with a dynamic K-factor, which enables tracking team performance over time. In addition, logistic regression models are used to explain the probability of winning a point based on team presence, score development, and match context. The thesis also addresses data quality limitations and team order changes throughout the tournament. Finally, the two modelling strategies are compared in terms of their explanatory power, interpretability, and practical applicability in the field of sports analytics, and potential extensions are discussed.