Application of advanced Machine Learning algorithms in Finance
| Thesis title: | Application of advanced Machine Learning algorithms in Finance |
|---|---|
| Author: | Rózsahegyi, Dávid |
| Thesis type: | Diploma thesis |
| Supervisor: | Drahokoupil, Jakub |
| Opponents: | Folprecht, Marek |
| Thesis language: | English |
| Abstract: | This thesis explores the application of advanced machine learning techniques in finance, specifically focusing on portfolio management using deep reinforcement learning. We propose and implement a hybrid PPO-LSTM model, combining the stability of Proximal Policy Optimization with the memory capacity of a recurrent LSTM network. The trained agent learns to optimize daily portfolio weights across a diversified basket of stocks, explicitly accounting for transaction costs. We evaluate three architectural variants along with a simple ensemble created by averaging their outputs. Using walk-forward validation, we assess model performance on data from 2010 to 2023. The results show that the agents tend to mitigate extreme drawdowns and achieve Sharpe ratios comparable to a passive benchmark, though often at the cost of lower exposure and higher turnover. The compact model performs best, offering a favorable balance between network complexity, gradient stability, and generalization. Additionally, we analyze turnover dynamics and sector exposure, which helps us to interpret the agent's behavior over time. |
| Keywords: | PPO; LSTM; reinforcement learning |
| Thesis title: | Aplikace pokročilých algoritmů strojového učení ve financích |
|---|---|
| Author: | Rózsahegyi, Dávid |
| Thesis type: | Diplomová práce |
| Supervisor: | Drahokoupil, Jakub |
| Opponents: | Folprecht, Marek |
| Thesis language: | English |
| Abstract: | Tato diplomová práce se zabývá využitím pokročilých metod strojového učení ve financích, konkrétně aplikací hlubokého posilovaného učení na problém řízení akciového portfolia. Navrhli a implementovali jsme hybridní model PPO-LSTM, který kombinuje stabilitu algoritmu Proximal Policy Optimization s paměťovou kapacitou rekurentní sítě LSTM. Trénovaný agent se učí denně optimalizovat váhové rozložení napříč diverzifikovaným portfoliem akcií, přičemž zohledňuje i transakční náklady. Testujeme tři architektonické varianty. Pomocí metody walk-forward validace hodnotíme výkonnost modelů na datech z let 2010-2023. Výsledky ukazují, že trénovaní agenti vykazují schopnost tlumit extrémní poklesy a dosahují Sharpeho poměru srovnatelného s pasivním benchmarkem, avšak často za cenu nižší expozice a vyšších nákladů. Nejlépe si vedl kompaktní model, který nabízí vyvážený poměr mezi komplexitou, stabilitou a generalizační schopností. Doplňkově analyzujeme i vývoj obratu a sektorové expozice, které přispívají k interpretaci chování modelu v čase. |
| Keywords: | posilované učení; PPO; LSTM |
Information about study
| Study programme: | Finanční inženýrství |
|---|---|
| Type of study programme: | Magisterský studijní program |
| Assigned degree: | Ing. |
| Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
| Faculty: | Faculty of Finance and Accounting |
| Department: | Department of Banking and Insurance |
Information on submission and defense
| Date of assignment: | 26. 3. 2024 |
|---|---|
| Date of submission: | 19. 8. 2025 |
| Date of defense: | 10. 9. 2025 |
| Identifier in the InSIS system: | https://insis.vse.cz/zp/88129/podrobnosti |