Detekce bodových anomálií v rozsáhlých hierarchických časových řadách: Metody a aplikace

Název práce: Detection of Point-Wise Anomalies in Large-Scale Hierarchical Time Series: Methods and Applications
Autor(ka) práce: Šarapatková, Magdalena Marie
Typ práce: Diploma thesis
Vedoucí práce: Zimmermann, Pavel
Oponenti práce: -
Jazyk práce: English
Abstrakt:
Anomaly detection in multivariate time series data is a critical challenge in various domains, including finance, healthcare, cyber security, retail, and many other fields. The ability to identify unexpected patterns or deviations in large-scale datasets has significant implications for decision-making and operational efficiency. This thesis focuses on the detection of outliers in hierarchical, high-dimensional time series data. The dataset presents a unique challenge due to its hierarchical structure of multiple stores and departments with interdependent sales patterns over time, making it a complex time series problem. In the first part of this thesis, a comprehensive review of theory and anomaly detection models is conducted, assessing their suitability for large scale hierarchical time series data. Based on the findings from the research phase, anomaly detection methods are selected and implemented on the dataset. The second part of the thesis applies these approaches to the data, comparing their effectiveness in identifying significant outliers. The results are then analyzed to assess their practical implications for real-world applications. This study contributes to the field by identifying robust methodologies for outlier detection in hierarchical time series data and providing actionable insights for businesses dealing with large-scale sales forecasting. The findings can support more informed decision-making, reducing financial losses and enhancing operational strategies. Point-wise anomaly detection, large-scale hierarchical multivariate time series, decomposition, unsupervised models, interpretability, scalability, evaluation, precision, hierarchical reconciliation.
Klíčová slova: Precision; Point-wise anomaly detection; Scalability; Evaluation; Interpretability; Hierarchical reconciliation; Large-scale hierarchical multivariate time series; Decomposition; Unsupervised models
Název práce: Detekce bodových anomálií v rozsáhlých hierarchických časových řadách: Metody a aplikace
Autor(ka) práce: Šarapatková, Magdalena Marie
Typ práce: Diplomová práce
Vedoucí práce: Zimmermann, Pavel
Oponenti práce: -
Jazyk práce: English
Abstrakt:
Detekce anomálií ve vícerozměrných časových řadách je klíčovou výzvou v mnoha oblastech, typu financí, zdravotnictví, kybernetické bezpečnosti, obchodu a dalších. Schopnost identifikovat neočekávané odchylky v rozsáhlých datových souborech má významné dopady na rozhodování a efektivitu provozu. Tato práce se zaměřuje na detekci odlehlých pozorování v hierarchických, vícedimenzionálních časových řadách. Dataset představuje specifickou výzvu kvůli své hierarchické struktuře, která obsahuje více obchodů a oddělení s vzájemně závislými vzory prodejů v čase, což z práce činí komplexní problém časových řad. První část této práce poskytuje rozsáhlý přehled teorie a metod detekce anomálií, přičemž hodnotí jejich vhodnost pro rozsáhlá a hierarchická data časových řad. Na základě závěrů z teoretické části jsou vybrány a implementovány vybrané metody detekce anomálií. Druhá část práce se věnuje aplikaci těchto metod na data a porovnává jejich efektivitu v identifikaci významných odlehlých hodnot. Výsledky aplikace jsou následně analyzovány s cílem posoudit jejich praktické dopady na reálné aplikace. Tato práce přispívá v oblasti detekce anomálií identifikací robustních metodologií pro hierarchická časová data a poskytuje využitelné poznatky pro podniky zabývající se rozsáhlým predikováním prodejů. Získané výsledky mohou podpořit informovanější rozhodování, snížit finanční ztráty nebo zlepšit strategické řízení provozu.
Klíčová slova: Bodová detekce anomálií; Rozsáhlé hierarchické multivariační časové řady; Dekompozoice; Nesupervizované modely; Interpretovatelnost; Škálovatelnost; Evaluace; Přesnost; Hierarchická rekonciliace

Informace o studiu

Studijní program / obor: Data a analytika pro business
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 30. 4. 2025
Datum podání práce: 5. 5. 2025
Datum obhajoby: 2025

Soubory ke stažení

Soubory budou k dispozici až po obhajobě práce.

    Poslední aktualizace: