Srovnání tradičních a machine learningových metod při modelování aktiv finančních trhů

Název práce: Srovnání tradičních a machine learningových metod při modelování aktiv finančních trhů
Autor(ka) práce: Tomášková, Tereza
Typ práce: Diplomová práce
Vedoucí práce: Šimpach, Ondřej
Oponenti práce: Helman, Karel
Jazyk práce: Česky
Abstrakt:
Tato práce se zabývá komparací metod tradiční statistiky a strojového učení při predikci logaritmických výnosů na různých typech aktiv. Pro lepší zobecnění chování aktiv jsou pro práci vybrány čtyři ETF, a to akciové, dluhopisové, komoditní a realitní. Jako zástupce tradičních metod jsou vybrány ARIMA a GARCH modely, pro strojové učení jsou zvoleny náhodné lesy, rekurentní neuronové sítě, dlouhé krátkodobé paměťové sítě a hybridní model neuronových sítí. V teoretické částí práce jsou představeny specifika finančních časových řad, transformace nutné pro práci s tradičními statistickými modely a následně jednotlivé metody modelování. V praktické části jsou ověřeny statistické předpoklady časových řad a vytvořeny modely. Jelikož ARIMA-GARCH model nedokázal odstranit heteroskedasticitu z reziduí, jsou pro následné predikce v rámci tradičních modelů použity pouze ARIMA modely. V rámci modelů strojového učení jsou definovány mřížkové vyhledávání, či náhodné vyhledávání pro práci s hyperparametry a zvoleny vhodné architektury modelů. Z výsledků vyplývá, že modely neuronových sítí dosahují lepších výsledků než ARIMA modely, zároveň ARIMA a hybridní model jsou jedinými modely, které ani u jednoho ETF nedosahují lepších výsledků, než při užití konstantního modelu, který predikuje pro každé období nulovou hodnotu.
Klíčová slova: GARCH; Krátké dlouhodobé paměťové sítě; ARIMA; Rekurentní neuronové sítě; Logaritmické výnosy; Náhodné lesy
Název práce: Comparison of traditional and machine learning methods in modelling financial market assets
Autor(ka) práce: Tomášková, Tereza
Typ práce: Diploma thesis
Vedoucí práce: Šimpach, Ondřej
Oponenti práce: Helman, Karel
Jazyk práce: Česky
Abstrakt:
This thesis compares methods of traditional statistics and machine learning in predicting logarithmic returns on different types of assets. To better generalize the asset behavior, four ETFs are selected for the paper, namely equity, bond, commodity and real estate. ARIMA and GARCH models are chosen as representatives of traditional methods, while random forests, recurrent neural networks, long short-term memory networks and hybrid neural network model are chosen for machine learning. The theoretical part of the paper introduces the specifics of financial time series, the transformations required to work with traditional statistical models, and then the different modeling methods. In the practical part, the statistical assumptions of the time series are verified and models are developed. Since the ARIMA-GARCH model failed to remove heteroskedasticity from the residuals, only ARIMA models are used for the predictions from the traditional models. Within the machine learning models, grid searches and random searches are defined to handle hyperparameters and appropriate model architectures are selected. The results show that neural network models perform better than ARIMA models, ARIMA and the hybrid model are also the only models that do not outperform constant model which only predicts zero for each period.
Klíčová slova: ARIMA; GARCH; Long short term memory networks; Random forest; Recurrent Neural Networks; Logarithmic returns

Informace o studiu

Studijní program / obor: Statistika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 23. 10. 2024
Datum podání práce: 26. 6. 2025
Datum obhajoby: 2025

Soubory ke stažení

Soubory budou k dispozici až po obhajobě práce.

    Poslední aktualizace: