Tato diplomová práce se zabývá porovnáním algoritmů strojového učení, které umožňují identifikovat pád akciového indexu na základě historického vývoje ceny. Z hlediska technické výkonnosti jsou porovnávány tyto algoritmy: lineární regrese, logistická regrese, rozhodovací stromy XGBoost, stroje s podpůrnými vektory (SVM) a rekurentní neuronová síť. Algoritmy jsou pak použity pro vývoj obchodní strategie, která umožňuje investorovi opustit trh, když mu model poskytne signál o nastávajícím pádu, a ... show full abstractTato diplomová práce se zabývá porovnáním algoritmů strojového učení, které umožňují identifikovat pád akciového indexu na základě historického vývoje ceny. Z hlediska technické výkonnosti jsou porovnávány tyto algoritmy: lineární regrese, logistická regrese, rozhodovací stromy XGBoost, stroje s podpůrnými vektory (SVM) a rekurentní neuronová síť. Algoritmy jsou pak použity pro vývoj obchodní strategie, která umožňuje investorovi opustit trh, když mu model poskytne signál o nastávajícím pádu, a ochránit ho tak před velkými ztrátami v jeho portfoliu. Případně lze signál využít i k zajištění proti ztrátě vstupem do krátké pozice ve futures nebo opcích. Tato strategie je pak porovnávána se strategií Buy and Hold, kterou používají konzervativní investoři. V práci bylo použito celkem 8 velkých světových akciových indexů, z nichž jeden (index S&P 500) byl použit pro testování a zbylých 7 pro trénování a validaci (tréninková data sedmi a 1 pro validaci tréninkových dat). Data pak představují časové řady za posledních 20 let v rozmezí od 1. 1. 2003 do 31. 12. 2022. Zvoleným měřítkem výkonnosti bylo F-beta skóre, které počítá vážený harmonický průměr precision a recall. Vyvinuté modely dosahovaly při předpovídání nadcházejícího pádáu v různých předpovědních obdobích výrazně lepších výsledků než srovnatelné náhodné modely. Empirická část je pak dále rozdělena na dva případy použití s různou identifikací pádu a různými obdobími předpovědi. Zatímco shallow algoritmy strojového učení byly schopny dosahovat lepších výsledků v delších obdobích předpovědi s nevyváženou cílovou proměnnou, rekurentní neuronová síť s architekturou LSTM dokázala dosahovat lepších výsledků, v případech kratších předpovědí a vyváženější cílové proměnné. Například v případě jednodenní předpovědi dokázala RNN za posledních 20 let překonat strategii Buy and Hold o více než 200 %. |