Analýza časových řad pomocí vybraných shlukovacích metod

Název práce: Analýza časových řad pomocí vybraných shlukovacích metod
Autor(ka) práce: Řeřicha, Václav
Typ práce: Bakalářská práce
Vedoucí práce: Horníček, Jaroslav
Oponenti práce: Bakuncová, Karolína
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zaměřuje na metody shlukování časových řad s důrazem na jejich aplikaci v klimatologii. Hlavním cílem je metodické porovnání klasického algoritmu k-průměrů využívajícího Euklidovskou vzdálenost a pokročilejšího nelineárního přístupu založeného na metrice Dynamic Time Warping v kombinaci s průměrováním Dynamic Time Warping Barycenter Averaging. Výzkum je rozdělen do dvou fází. V první fázi jsou algoritmy testovány na kontrolovaných simulovaných datech (zahrnujících fázový posun, změnu frekvence a benchmarkový model Cylinder-Bell-Funnel), kde se hodnotí jejich přesnost pomocí Adjusted Rand Indexu. Ve druhé fázi jsou otestované modely aplikovány na reálná měření globálních povrchových teplot z databáze Berkeley Earth. Práce detailně analyzuje vliv standardizace dat a zaměřuje se na geografickou regionalizaci klimatu i detekci stochastických teplotních extrémů, konkrétně vln veder. Dosažené výsledky prokazují, že zatímco Euklidovská vzdálenost selhává při analýze asynchronních deformací, metrika Dynamic Time Warping představuje vysoce robustní nástroj pro shlukování tvarově specifických jevů nezávisle na jejich fázovém posunu.
Klíčová slova: klimatologie; shluková analýza; časové řady; Dynamic Time Warping; Euklidovská vzdálenost; k-průměrů
Název práce: Time series analysis using selected clustering methods
Autor(ka) práce: Řeřicha, Václav
Typ práce: Bachelor thesis
Vedoucí práce: Horníček, Jaroslav
Oponenti práce: Bakuncová, Karolína
Jazyk práce: Česky
Abstrakt:
This bachelor project focuses on time series clustering methods with an emphasis on their application in climatology. The main objective is a methodological comparison of the classical k-means algorithm using Euclidean distance and a more advanced non-linear approach based on the Dynamic Time Warping metric combined with Dynamic Time Warping Barycenter Averaging. The research is divided into two phases. In the first phase, the algorithms are tested on controlled simulated data (including phase shifts, frequency changes, and the benchmark Cylinder-Bell-Funnel model), evaluating their accuracy using the Adjusted Rand Index. In the second phase, the tested models are applied to real global surface temperature measurements from the Berkeley Earth database. The thesis analyzes in detail the impact of data standardization and focuses on the geographical regionalization of climate as well as the detection of stochastic temperature extremes, specifically heat waves. The achieved results demonstrate that while Euclidean distance fails in the analysis of asynchronous deformations, the Dynamic Time Warping metric represents a highly robust tool for clustering shape-specific events independent of their phase shift.
Klíčová slova: Euclidean distance; climatology; k-means; time series; Dynamic Time Warping; cluster analysis

Informace o studiu

Studijní program / obor: Matematické metody v ekonomii/Datové analýzy a modelování
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 4. 11. 2025
Datum podání práce: 10. 5. 2026
Datum obhajoby: 8. 6. 2026
Identifikátor v systému InSIS: https://insis.vse.cz/zp/94353/podrobnosti

Soubory ke stažení

    Poslední aktualizace: