Thesis title: |
Srovnání tradičních a machine learningových metod při modelování aktiv finančních trhů |
Author: |
Tomášková, Tereza |
Thesis type: |
Diplomová práce |
Supervisor: |
Šimpach, Ondřej |
Opponents: |
Helman, Karel |
Thesis language: |
Česky |
Abstract: |
Tato práce se zabývá komparací metod tradiční statistiky a strojového učení při predikci logaritmických výnosů na různých typech aktiv. Pro lepší zobecnění chování aktiv jsou pro práci vybrány čtyři ETF, a to akciové, dluhopisové, komoditní a realitní. Jako zástupce tradičních metod jsou vybrány ARIMA a GARCH modely, pro strojové učení jsou zvoleny náhodné lesy, rekurentní neuronové sítě, dlouhé krátkodobé paměťové sítě a hybridní model neuronových sítí. V teoretické částí práce jsou představeny specifika finančních časových řad, transformace nutné pro práci s tradičními statistickými modely a následně jednotlivé metody modelování. V praktické části jsou ověřeny statistické předpoklady časových řad a vytvořeny modely. Jelikož ARIMA-GARCH model nedokázal odstranit heteroskedasticitu z reziduí, jsou pro následné predikce v rámci tradičních modelů použity pouze ARIMA modely. V rámci modelů strojového učení jsou definovány mřížkové vyhledávání, či náhodné vyhledávání pro práci s hyperparametry a zvoleny vhodné architektury modelů. Z výsledků vyplývá, že modely neuronových sítí dosahují lepších výsledků než ARIMA modely, zároveň ARIMA a hybridní model jsou jedinými modely, které ani u jednoho ETF nedosahují lepších výsledků, než při užití konstantního modelu, který predikuje pro každé období nulovou hodnotu. |
Keywords: |
GARCH; Krátké dlouhodobé paměťové sítě; ARIMA; Rekurentní neuronové sítě; Logaritmické výnosy; Náhodné lesy |
Thesis title: |
Comparison of traditional and machine learning methods in modelling financial market assets |
Author: |
Tomášková, Tereza |
Thesis type: |
Diploma thesis |
Supervisor: |
Šimpach, Ondřej |
Opponents: |
Helman, Karel |
Thesis language: |
Česky |
Abstract: |
This thesis compares methods of traditional statistics and machine learning in predicting logarithmic returns on different types of assets. To better generalize the asset behavior, four ETFs are selected for the paper, namely equity, bond, commodity and real estate. ARIMA and GARCH models are chosen as representatives of traditional methods, while random forests, recurrent neural networks, long short-term memory networks and hybrid neural network model are chosen for machine learning. The theoretical part of the paper introduces the specifics of financial time series, the transformations required to work with traditional statistical models, and then the different modeling methods. In the practical part, the statistical assumptions of the time series are verified and models are developed. Since the ARIMA-GARCH model failed to remove heteroskedasticity from the residuals, only ARIMA models are used for the predictions from the traditional models. Within the machine learning models, grid searches and random searches are defined to handle hyperparameters and appropriate model architectures are selected. The results show that neural network models perform better than ARIMA models, ARIMA and the hybrid model are also the only models that do not outperform constant model which only predicts zero for each period. |
Keywords: |
ARIMA; GARCH; Long short term memory networks; Random forest; Recurrent Neural Networks; Logarithmic returns |
Information about study
Study programme: |
Statistika |
Type of study programme: |
Magisterský studijní program |
Assigned degree: |
Ing. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Statistics and Probability |
Information on submission and defense
Date of assignment: |
23. 10. 2024 |
Date of submission: |
26. 6. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.