Predikce časových řad pomocí log-lineárních modelů
Autor(ka) práce:
Martinová, Kristýna
Typ práce:
Diplomová práce
Vedoucí práce:
Zouhar, Jan
Oponenti práce:
Tomanová, Petra
Jazyk práce:
Česky
Abstrakt:
Log-lineární modely jsou důležitým nástrojem v analýze časových řad a jsou široce používány v mnoha oblastech vědeckého výzkumu a praktických aplikací. Problematika spojená s logaritmicky transformovanou závislou proměnnou spočívá v nutnosti transformovat predikované hodnoty zpět na původní škálu. Práce navazuje na bakalářskou práci, která se zabývala korekcí vychýlení při predikcích v log-lineárních modelech s heterogenními daty pomocí numerických simulací nad průřezovými daty. Cílem diplomové práce je rozšířit tuto problematiku na časové řady. Dosavadní výsledky jsou rozšířeny zejména o problematiku sériové korelace v kontextu zpětné transformace predikovaných hodnot z logaritmické škály na škálu původní, úrovňovou. Navržená simulační studie hodnotí predikční schopnosti log-lineárních modelů na časových řadách, jejichž náhodná složka obsahuje různou míru heteroskedasticity a autokorelace a řídí se různými rozděleními. Vedle naivní predikce jsou porovnávány výsledky metody podle Basera (upravené pro časové řady) a metody, která nově kombinuje korekci heteroskedasticity se zohledněním autokorelace. Metody jsou testovány na různě dlouhých predikčních horizontech. Součástí práce je i aplikace testovaných metod na reálné časové řady, konkrétně na data z M5 Forecasting Competition, kde jsou použity různě složité modely. Výsledky ukazují, že zohlednění autokorelace přináší zřetelný přínos zejména v případě jedno-krokové predikce. Při delších predikčních horizontech se výhoda korekce autokorelace postupně vytrácí.
Log-linear models are an important tool in time series analysis and are widely used in many areas of scientific research and practical applications. The issue associated with logarithmically transformed dependent variable lies in the need to transform predicted values back to the original scale. This work builds upon a bachelor's thesis that dealt with bias correction in predictions in log-linear models with heterogeneous data using numerical simulations on cross-sectional data. The aim of this thesis is to extend this issue to time series. The existing results are expanded particularly to address the issue of serial correlation in the context of retransforming predicted values from the logarithmic scale to the original level scale. The proposed simulation study evaluates the predictive performance of log-linear models on time series whose error term exhibits varying degrees of heteroskedasticity and autocorrelation and follows different distributions. In addition to the naive approach, the results of the method proposed by Baser (adapted for time series) are compared with a method newly developed to account for both heteroskedasticity and autocorrelation. The methods are tested across prediction horizons of varying lengths. The thesis also includes an application of the evaluated methods to real time series, specifically to data from the M5 Forecasting Competition, using models of varying complexity. The results show that accounting for autocorrelation brings a clear benefit, especially in one-step-ahead predictions. However, as the prediction horizon increases, the advantage of autocorrelation correction gradually diminishes.