Detection of Point-Wise Anomalies in Large-Scale Hierarchical Time Series: Methods and Applications

Thesis title: Detection of Point-Wise Anomalies in Large-Scale Hierarchical Time Series: Methods and Applications
Author: Šarapatková, Magdalena Marie
Thesis type: Diploma thesis
Supervisor: Zimmermann, Pavel
Opponents: -
Thesis language: English
Abstract:
Anomaly detection in multivariate time series data is a critical challenge in various domains, including finance, healthcare, cyber security, retail, and many other fields. The ability to identify unexpected patterns or deviations in large-scale datasets has significant implications for decision-making and operational efficiency. This thesis focuses on the detection of outliers in hierarchical, high-dimensional time series data. The dataset presents a unique challenge due to its hierarchical structure of multiple stores and departments with interdependent sales patterns over time, making it a complex time series problem. In the first part of this thesis, a comprehensive review of theory and anomaly detection models is conducted, assessing their suitability for large scale hierarchical time series data. Based on the findings from the research phase, anomaly detection methods are selected and implemented on the dataset. The second part of the thesis applies these approaches to the data, comparing their effectiveness in identifying significant outliers. The results are then analyzed to assess their practical implications for real-world applications. This study contributes to the field by identifying robust methodologies for outlier detection in hierarchical time series data and providing actionable insights for businesses dealing with large-scale sales forecasting. The findings can support more informed decision-making, reducing financial losses and enhancing operational strategies. Point-wise anomaly detection, large-scale hierarchical multivariate time series, decomposition, unsupervised models, interpretability, scalability, evaluation, precision, hierarchical reconciliation.
Keywords: Precision; Point-wise anomaly detection; Scalability; Evaluation; Interpretability; Hierarchical reconciliation; Large-scale hierarchical multivariate time series; Decomposition; Unsupervised models
Thesis title: Detekce bodových anomálií v rozsáhlých hierarchických časových řadách: Metody a aplikace
Author: Šarapatková, Magdalena Marie
Thesis type: Diplomová práce
Supervisor: Zimmermann, Pavel
Opponents: -
Thesis language: English
Abstract:
Detekce anomálií ve vícerozměrných časových řadách je klíčovou výzvou v mnoha oblastech, typu financí, zdravotnictví, kybernetické bezpečnosti, obchodu a dalších. Schopnost identifikovat neočekávané odchylky v rozsáhlých datových souborech má významné dopady na rozhodování a efektivitu provozu. Tato práce se zaměřuje na detekci odlehlých pozorování v hierarchických, vícedimenzionálních časových řadách. Dataset představuje specifickou výzvu kvůli své hierarchické struktuře, která obsahuje více obchodů a oddělení s vzájemně závislými vzory prodejů v čase, což z práce činí komplexní problém časových řad. První část této práce poskytuje rozsáhlý přehled teorie a metod detekce anomálií, přičemž hodnotí jejich vhodnost pro rozsáhlá a hierarchická data časových řad. Na základě závěrů z teoretické části jsou vybrány a implementovány vybrané metody detekce anomálií. Druhá část práce se věnuje aplikaci těchto metod na data a porovnává jejich efektivitu v identifikaci významných odlehlých hodnot. Výsledky aplikace jsou následně analyzovány s cílem posoudit jejich praktické dopady na reálné aplikace. Tato práce přispívá v oblasti detekce anomálií identifikací robustních metodologií pro hierarchická časová data a poskytuje využitelné poznatky pro podniky zabývající se rozsáhlým predikováním prodejů. Získané výsledky mohou podpořit informovanější rozhodování, snížit finanční ztráty nebo zlepšit strategické řízení provozu.
Keywords: Bodová detekce anomálií; Rozsáhlé hierarchické multivariační časové řady; Dekompozoice; Nesupervizované modely; Interpretovatelnost; Škálovatelnost; Evaluace; Přesnost; Hierarchická rekonciliace

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 30. 4. 2025
Date of submission: 5. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: