Thesis title: |
Forecasting Macrofinancial Time Series with Machine Learning Methods |
Author: |
Simon, Jan |
Thesis type: |
Diploma thesis |
Supervisor: |
Plašil, Miroslav |
Opponents: |
Karel, Tomáš |
Thesis language: |
English |
Abstract: |
Unlike the standard supervised learning setting, forecasting time series poses different challenges due to their inherent time dependence, non-stationarity, and susceptibility to structural shifts. Traditional econometric models, while powerful, might struggle capturing the nonlinear patterns and high-dimensional dependencies present in such data. In recent years, machine learning (ML) methods have emerged as promising alternatives, offering flexible approaches to modeling and prediction. In this thesis, we (1) build the foundational knowledge related to timeseries as well as practical applications , (2) introduce the basic building blocks of both classical and ML algorithms and finally (3) compare these models in multiple different settings - low to high amount of training data with low to high forecasting horizons. Finally, all tests are conducted on 3 different real world datasets to allow us to generalize our findings. We find that ensemble methods perform better across majority of settings, with the exception of low signal-to-noise datasets, where simpler methods perform better. Additionally, regularized models tend to perform at least as good as its non-regularized counterparts, though at the cost of computation. |
Keywords: |
Time series; Machine learning; Probability theory |
Thesis title: |
Předpovídání makrofinančních časových řad pomocí strojového učení |
Author: |
Simon, Jan |
Thesis type: |
Diplomová práce |
Supervisor: |
Plašil, Miroslav |
Opponents: |
Karel, Tomáš |
Thesis language: |
English |
Abstract: |
Na rozdíl od standardního supervizorního učení představuje předpovídání časových řad odlišné výzvy kvůli jejich časové závislosti, nestacionaritě a náchylnosti ke strukturálním změnám. Tradiční ekonometrické modely, mohou mít potíže s zachycením nelineárních vztahů či vysoce dimenzionálních závislostí. V poslední době se metody strojového učení (ML) ukázaly jako slibné alternativy, které nabízejí flexibilnější přístupy k modelování a predikci. V této práci (1) nastíníme základní znalosti týkající se časových řad a jejich praktického využití, (2) představíme základní stavební bloky jak klasických, tak ML algoritmů, a nakonec (3) porovnáváme tyto modely v různých situacích – od nízké po vysoké množství trénovací množiny a od krátkých po dlouhé predikční horizonty. Všechny testy jsou prováděny na třech různých reálných datových sadách, což nám umožňuje zobecnit naše zjištění. Zjistili jsme, že ensemble metody dosahují lepších výsledků ve většině situacích, s výjimkou dat s velkým množstvím šumu, kde si lépe vedou jednodušší metody. Navíc regularizované modely mají tendenci dosahovat alespoň stejně dobrých výsledků jako jejich neregularizované protějšky, avšak za cenu vyšší výpočetní náročnosti. |
Keywords: |
Strojové učení; Teorie Pravděpodobnosti; Časové řady |
Information about study
Study programme: |
Statistika |
Type of study programme: |
Magisterský studijní program |
Assigned degree: |
Ing. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Statistics and Probability |
Information on submission and defense
Date of assignment: |
26. 10. 2022 |
Date of submission: |
3. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.