Thesis title: |
Detection of Point-Wise Anomalies in Large-Scale Hierarchical Time Series: Methods and Applications |
Author: |
Šarapatková, Magdalena Marie |
Thesis type: |
Diploma thesis |
Supervisor: |
Zimmermann, Pavel |
Opponents: |
- |
Thesis language: |
English |
Abstract: |
Anomaly detection in multivariate time series data is a critical challenge in various domains, including finance, healthcare, cyber security, retail, and many other fields. The ability to identify unexpected patterns or deviations in large-scale datasets has significant implications for decision-making and operational efficiency. This thesis focuses on the detection of outliers in hierarchical, high-dimensional time series data. The dataset presents a unique challenge due to its hierarchical structure of multiple stores and departments with interdependent sales patterns over time, making it a complex time series problem. In the first part of this thesis, a comprehensive review of theory and anomaly detection models is conducted, assessing their suitability for large scale hierarchical time series data. Based on the findings from the research phase, anomaly detection methods are selected and implemented on the dataset. The second part of the thesis applies these approaches to the data, comparing their effectiveness in identifying significant outliers. The results are then analyzed to assess their practical implications for real-world applications. This study contributes to the field by identifying robust methodologies for outlier detection in hierarchical time series data and providing actionable insights for businesses dealing with large-scale sales forecasting. The findings can support more informed decision-making, reducing financial losses and enhancing operational strategies. Point-wise anomaly detection, large-scale hierarchical multivariate time series, decomposition, unsupervised models, interpretability, scalability, evaluation, precision, hierarchical reconciliation. |
Keywords: |
Precision; Point-wise anomaly detection; Scalability; Evaluation; Interpretability; Hierarchical reconciliation; Large-scale hierarchical multivariate time series; Decomposition; Unsupervised models |
Thesis title: |
Detekce bodových anomálií v rozsáhlých hierarchických časových řadách: Metody a aplikace |
Author: |
Šarapatková, Magdalena Marie |
Thesis type: |
Diplomová práce |
Supervisor: |
Zimmermann, Pavel |
Opponents: |
- |
Thesis language: |
English |
Abstract: |
Detekce anomálií ve vícerozměrných časových řadách je klíčovou výzvou v mnoha oblastech, typu financí, zdravotnictví, kybernetické bezpečnosti, obchodu a dalších. Schopnost identifikovat neočekávané odchylky v rozsáhlých datových souborech má významné dopady na rozhodování a efektivitu provozu. Tato práce se zaměřuje na detekci odlehlých pozorování v hierarchických, vícedimenzionálních časových řadách. Dataset představuje specifickou výzvu kvůli své hierarchické struktuře, která obsahuje více obchodů a oddělení s vzájemně závislými vzory prodejů v čase, což z práce činí komplexní problém časových řad. První část této práce poskytuje rozsáhlý přehled teorie a metod detekce anomálií, přičemž hodnotí jejich vhodnost pro rozsáhlá a hierarchická data časových řad. Na základě závěrů z teoretické části jsou vybrány a implementovány vybrané metody detekce anomálií. Druhá část práce se věnuje aplikaci těchto metod na data a porovnává jejich efektivitu v identifikaci významných odlehlých hodnot. Výsledky aplikace jsou následně analyzovány s cílem posoudit jejich praktické dopady na reálné aplikace. Tato práce přispívá v oblasti detekce anomálií identifikací robustních metodologií pro hierarchická časová data a poskytuje využitelné poznatky pro podniky zabývající se rozsáhlým predikováním prodejů. Získané výsledky mohou podpořit informovanější rozhodování, snížit finanční ztráty nebo zlepšit strategické řízení provozu. |
Keywords: |
Bodová detekce anomálií; Rozsáhlé hierarchické multivariační časové řady; Dekompozoice; Nesupervizované modely; Interpretovatelnost; Škálovatelnost; Evaluace; Přesnost; Hierarchická rekonciliace |
Information about study
Study programme: |
Data a analytika pro business |
Type of study programme: |
Magisterský studijní program |
Assigned degree: |
Ing. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Information Technologies |
Information on submission and defense
Date of assignment: |
30. 4. 2025 |
Date of submission: |
5. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.