Application of advanced Machine Learning algorithms in Finance

Thesis title: Application of advanced Machine Learning algorithms in Finance
Author: Rózsahegyi, Dávid
Thesis type: Diploma thesis
Supervisor: Drahokoupil, Jakub
Opponents: Folprecht, Marek
Thesis language: English
Abstract:
This thesis explores the application of advanced machine learning techniques in finance, specifically focusing on portfolio management using deep reinforcement learning. We propose and implement a hybrid PPO-LSTM model, combining the stability of Proximal Policy Optimization with the memory capacity of a recurrent LSTM network. The trained agent learns to optimize daily portfolio weights across a diversified basket of stocks, explicitly accounting for transaction costs. We evaluate three architectural variants along with a simple ensemble created by averaging their outputs. Using walk-forward validation, we assess model performance on data from 2010 to 2023. The results show that the agents tend to mitigate extreme drawdowns and achieve Sharpe ratios comparable to a passive benchmark, though often at the cost of lower exposure and higher turnover. The compact model performs best, offering a favorable balance between network complexity, gradient stability, and generalization. Additionally, we analyze turnover dynamics and sector exposure, which helps us to interpret the agent's behavior over time.
Keywords: PPO; LSTM; reinforcement learning
Thesis title: Aplikace pokročilých algoritmů strojového učení ve financích
Author: Rózsahegyi, Dávid
Thesis type: Diplomová práce
Supervisor: Drahokoupil, Jakub
Opponents: Folprecht, Marek
Thesis language: English
Abstract:
Tato diplomová práce se zabývá využitím pokročilých metod strojového učení ve financích, konkrétně aplikací hlubokého posilovaného učení na problém řízení akciového portfolia. Navrhli a implementovali jsme hybridní model PPO-LSTM, který kombinuje stabilitu algoritmu Proximal Policy Optimization s paměťovou kapacitou rekurentní sítě LSTM. Trénovaný agent se učí denně optimalizovat váhové rozložení napříč diverzifikovaným portfoliem akcií, přičemž zohledňuje i transakční náklady. Testujeme tři architektonické varianty. Pomocí metody walk-forward validace hodnotíme výkonnost modelů na datech z let 2010-2023. Výsledky ukazují, že trénovaní agenti vykazují schopnost tlumit extrémní poklesy a dosahují Sharpeho poměru srovnatelného s pasivním benchmarkem, avšak často za cenu nižší expozice a vyšších nákladů. Nejlépe si vedl kompaktní model, který nabízí vyvážený poměr mezi komplexitou, stabilitou a generalizační schopností. Doplňkově analyzujeme i vývoj obratu a sektorové expozice, které přispívají k interpretaci chování modelu v čase.
Keywords: posilované učení; PPO; LSTM

Information about study

Study programme: Finanční inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 26. 3. 2024
Date of submission: 19. 8. 2025
Date of defense: 10. 9. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/88129/podrobnosti

Files for download

    Last update: