Aplikace pokročilých algoritmů strojového učení ve financích
| Název práce: | Application of advanced Machine Learning algorithms in Finance |
|---|---|
| Autor(ka) práce: | Rózsahegyi, Dávid |
| Typ práce: | Diploma thesis |
| Vedoucí práce: | Drahokoupil, Jakub |
| Oponenti práce: | Folprecht, Marek |
| Jazyk práce: | English |
| Abstrakt: | This thesis explores the application of advanced machine learning techniques in finance, specifically focusing on portfolio management using deep reinforcement learning. We propose and implement a hybrid PPO-LSTM model, combining the stability of Proximal Policy Optimization with the memory capacity of a recurrent LSTM network. The trained agent learns to optimize daily portfolio weights across a diversified basket of stocks, explicitly accounting for transaction costs. We evaluate three architectural variants along with a simple ensemble created by averaging their outputs. Using walk-forward validation, we assess model performance on data from 2010 to 2023. The results show that the agents tend to mitigate extreme drawdowns and achieve Sharpe ratios comparable to a passive benchmark, though often at the cost of lower exposure and higher turnover. The compact model performs best, offering a favorable balance between network complexity, gradient stability, and generalization. Additionally, we analyze turnover dynamics and sector exposure, which helps us to interpret the agent's behavior over time. |
| Klíčová slova: | PPO; LSTM; reinforcement learning |
| Název práce: | Aplikace pokročilých algoritmů strojového učení ve financích |
|---|---|
| Autor(ka) práce: | Rózsahegyi, Dávid |
| Typ práce: | Diplomová práce |
| Vedoucí práce: | Drahokoupil, Jakub |
| Oponenti práce: | Folprecht, Marek |
| Jazyk práce: | English |
| Abstrakt: | Tato diplomová práce se zabývá využitím pokročilých metod strojového učení ve financích, konkrétně aplikací hlubokého posilovaného učení na problém řízení akciového portfolia. Navrhli a implementovali jsme hybridní model PPO-LSTM, který kombinuje stabilitu algoritmu Proximal Policy Optimization s paměťovou kapacitou rekurentní sítě LSTM. Trénovaný agent se učí denně optimalizovat váhové rozložení napříč diverzifikovaným portfoliem akcií, přičemž zohledňuje i transakční náklady. Testujeme tři architektonické varianty. Pomocí metody walk-forward validace hodnotíme výkonnost modelů na datech z let 2010-2023. Výsledky ukazují, že trénovaní agenti vykazují schopnost tlumit extrémní poklesy a dosahují Sharpeho poměru srovnatelného s pasivním benchmarkem, avšak často za cenu nižší expozice a vyšších nákladů. Nejlépe si vedl kompaktní model, který nabízí vyvážený poměr mezi komplexitou, stabilitou a generalizační schopností. Doplňkově analyzujeme i vývoj obratu a sektorové expozice, které přispívají k interpretaci chování modelu v čase. |
| Klíčová slova: | posilované učení; PPO; LSTM |
Informace o studiu
| Studijní program / obor: | Finanční inženýrství |
|---|---|
| Typ studijního programu: | Magisterský studijní program |
| Přidělovaná hodnost: | Ing. |
| Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
| Fakulta: | Fakulta financí a účetnictví |
| Katedra: | Katedra bankovnictví a pojišťovnictví |
Informace o odevzdání a obhajobě
| Datum zadání práce: | 26. 3. 2024 |
|---|---|
| Datum podání práce: | 19. 8. 2025 |
| Datum obhajoby: | 10. 9. 2025 |
| Identifikátor v systému InSIS: | https://insis.vse.cz/zp/88129/podrobnosti |