Machine Learning in Prediction of Asset Price Bubble Bursts

Thesis title: Machine Learning in Prediction of Asset Price Bubble Bursts
Author: Hvězda, Martin
Thesis type: Diploma thesis
Supervisor: Fičura, Milan
Opponents: Palán, Luděk
Thesis language: English
Abstract:
This master thesis deals with a comparison of machine learning algorithms to be able to identify a bubble burst in form of a crash in a stock index based on prior price patterns. The algorithms compared in terms of technical performance are: linear regression, logistic regression, XGBoost decision trees, support vector machines and a recurrent neural network. The algorithms are then used for development of trading strategy that enables an investor to exit the market when provided with a crash signal from the model to protect them from large losses in their portfolio. Alternatively, the signal can also be used to hedge against the loss by entering a short position in futures or options. This strategy is then compared with a Buy and Hold strategy used by conservative investors. A total number of 8 large world stock indexes were used in the work, out of which one (S&P 500 Index) was used for testing and the remaining 7 for training and validation (training set of 7 and 1 for the validation of training data). The data are then time series for the last 20 years ranging from 01/01/2003 until 31.12.2022. The selected performance measure was F-beta score that calculates the weighted harmonic mean of accuracy and recall. The developed models performed significantly better than comparable random models in predicting an upcoming crash in different prediction periods. The empirical part is then further divided into two use cases with different identification of a crash and different prediction periods. While shallow machine learning models were able to perform better in longer prediction periods with unbalanced target variable, a Recurrent Neural Network with LSTM architecture managed to deliver better results when the prediction periods are shorter, and more balance is introduced into the response variable. For example, in case of a 1-day prediction, the RNN was able to outperform the Buy and Hold strategy by more than 200 % in the last 20 years.
Keywords: crash detection; machine learning; asset price bubble; recurrent neural network
Thesis title: Metody strojového učení v predikcích prasknutí bublin na finančních aktivech
Author: Hvězda, Martin
Thesis type: Diplomová práce
Supervisor: Fičura, Milan
Opponents: Palán, Luděk
Thesis language: English
Abstract:
Tato diplomová práce se zabývá porovnáním algoritmů strojového učení, které umožňují identifikovat pád akciového indexu na základě historického vývoje ceny. Z hlediska technické výkonnosti jsou porovnávány tyto algoritmy: lineární regrese, logistická regrese, rozhodovací stromy XGBoost, stroje s podpůrnými vektory (SVM) a rekurentní neuronová síť. Algoritmy jsou pak použity pro vývoj obchodní strategie, která umožňuje investorovi opustit trh, když mu model poskytne signál o nastávajícím pádu, a ochránit ho tak před velkými ztrátami v jeho portfoliu. Případně lze signál využít i k zajištění proti ztrátě vstupem do krátké pozice ve futures nebo opcích. Tato strategie je pak porovnávána se strategií Buy and Hold, kterou používají konzervativní investoři. V práci bylo použito celkem 8 velkých světových akciových indexů, z nichž jeden (index S&P 500) byl použit pro testování a zbylých 7 pro trénování a validaci (tréninková data sedmi a 1 pro validaci tréninkových dat). Data pak představují časové řady za posledních 20 let v rozmezí od 1. 1. 2003 do 31. 12. 2022. Zvoleným měřítkem výkonnosti bylo F-beta skóre, které počítá vážený harmonický průměr precision a recall. Vyvinuté modely dosahovaly při předpovídání nadcházejícího pádáu v různých předpovědních obdobích výrazně lepších výsledků než srovnatelné náhodné modely. Empirická část je pak dále rozdělena na dva případy použití s různou identifikací pádu a různými obdobími předpovědi. Zatímco shallow algoritmy strojového učení byly schopny dosahovat lepších výsledků v delších obdobích předpovědi s nevyváženou cílovou proměnnou, rekurentní neuronová síť s architekturou LSTM dokázala dosahovat lepších výsledků, v případech kratších předpovědí a vyváženější cílové proměnné. Například v případě jednodenní předpovědi dokázala RNN za posledních 20 let překonat strategii Buy and Hold o více než 200 %.
Keywords: strojové učení; identifikace pádu; bublina; rekurentní neuronová síť

Information about study

Study programme: Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 26. 2. 2021
Date of submission: 10. 5. 2023
Date of defense: 8. 6. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/76426/podrobnosti

Files for download

    Last update: