Comparison of traditional and machine learning methods in modelling financial market assets

Thesis title: Srovnání tradičních a machine learningových metod při modelování aktiv finančních trhů
Author: Tomášková, Tereza
Thesis type: Diplomová práce
Supervisor: Šimpach, Ondřej
Opponents: Helman, Karel
Thesis language: Česky
Abstract:
Tato práce se zabývá komparací metod tradiční statistiky a strojového učení při predikci logaritmických výnosů na různých typech aktiv. Pro lepší zobecnění chování aktiv jsou pro práci vybrány čtyři ETF, a to akciové, dluhopisové, komoditní a realitní. Jako zástupce tradičních metod jsou vybrány ARIMA a GARCH modely, pro strojové učení jsou zvoleny náhodné lesy, rekurentní neuronové sítě, dlouhé krátkodobé paměťové sítě a hybridní model neuronových sítí. V teoretické částí práce jsou představeny specifika finančních časových řad, transformace nutné pro práci s tradičními statistickými modely a následně jednotlivé metody modelování. V praktické části jsou ověřeny statistické předpoklady časových řad a vytvořeny modely. Jelikož ARIMA-GARCH model nedokázal odstranit heteroskedasticitu z reziduí, jsou pro následné predikce v rámci tradičních modelů použity pouze ARIMA modely. V rámci modelů strojového učení jsou definovány mřížkové vyhledávání, či náhodné vyhledávání pro práci s hyperparametry a zvoleny vhodné architektury modelů. Z výsledků vyplývá, že modely neuronových sítí dosahují lepších výsledků než ARIMA modely, zároveň ARIMA a hybridní model jsou jedinými modely, které ani u jednoho ETF nedosahují lepších výsledků, než při užití konstantního modelu, který predikuje pro každé období nulovou hodnotu.
Keywords: GARCH; Krátké dlouhodobé paměťové sítě; ARIMA; Rekurentní neuronové sítě; Logaritmické výnosy; Náhodné lesy
Thesis title: Comparison of traditional and machine learning methods in modelling financial market assets
Author: Tomášková, Tereza
Thesis type: Diploma thesis
Supervisor: Šimpach, Ondřej
Opponents: Helman, Karel
Thesis language: Česky
Abstract:
This thesis compares methods of traditional statistics and machine learning in predicting logarithmic returns on different types of assets. To better generalize the asset behavior, four ETFs are selected for the paper, namely equity, bond, commodity and real estate. ARIMA and GARCH models are chosen as representatives of traditional methods, while random forests, recurrent neural networks, long short-term memory networks and hybrid neural network model are chosen for machine learning. The theoretical part of the paper introduces the specifics of financial time series, the transformations required to work with traditional statistical models, and then the different modeling methods. In the practical part, the statistical assumptions of the time series are verified and models are developed. Since the ARIMA-GARCH model failed to remove heteroskedasticity from the residuals, only ARIMA models are used for the predictions from the traditional models. Within the machine learning models, grid searches and random searches are defined to handle hyperparameters and appropriate model architectures are selected. The results show that neural network models perform better than ARIMA models, ARIMA and the hybrid model are also the only models that do not outperform constant model which only predicts zero for each period.
Keywords: ARIMA; GARCH; Long short term memory networks; Random forest; Recurrent Neural Networks; Logarithmic returns

Information about study

Study programme: Statistika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 23. 10. 2024
Date of submission: 26. 6. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: