Tato diplomová práce zkoumá, jak lze předpovědi časových řad zlepšit použitím velkých jazykových modelů. Je zvolena diskrétní časová řada ceny EUR/USD v pracovních dnech a dále dva zdroje článků, jejichž očekávaný vliv na cenu EUR/USD je kvantifikován, fxnewssite reprezentující odborné zpravodajství a bbc reprezentující obecné zpravodajství. Je zkonstruován předfiltr vlivu umožňující výběr relevantních článků z obecného zpravodajství. Analyzováno je 2 krát (bez předfiltru a s předfiltrem) 444 článků... show full abstractTato diplomová práce zkoumá, jak lze předpovědi časových řad zlepšit použitím velkých jazykových modelů. Je zvolena diskrétní časová řada ceny EUR/USD v pracovních dnech a dále dva zdroje článků, jejichž očekávaný vliv na cenu EUR/USD je kvantifikován, fxnewssite reprezentující odborné zpravodajství a bbc reprezentující obecné zpravodajství. Je zkonstruován předfiltr vlivu umožňující výběr relevantních článků z obecného zpravodajství. Analyzováno je 2 krát (bez předfiltru a s předfiltrem) 444 článků z každého zdroje (fxnewssite a bbc) v období mezi 01. 10. 2021 a 31. 12. 2023. Očekávaný vliv článků na cenu EUR/USD je kvantifikován velkým jazykovým modelem gpt-3.5-turbo-1106 se čtyřmi vytvořenými šablonami. Pro časovou řadu a vybrané kombinace šablon jejichž vlivy jsou zahrnuty do modelu jsou natrénovány dva modely strojového učení, základní pouze s cenami a endogenními proměnnými získanými z data a cen tvořením vlastností a druhý rozšířený o atributy vytvořené velkým jazykovým modelem. Rozdíl v predikci je změřen. V analyzovaných případech kdy byl k dispozici relevantní a kvalitní textový zdroj fxnewssite, bylo dosaženo zlepšení pětidenní predikce v rozsahu od 12.38 do 15.35 procent při použití vlivů napočítaných vždy jednou šablonou bez zapojení předfiltru vlivu. U zdroje bbc způsobí předfiltr vlivu posun průměrné predikce z jednotlivých šablon ze zlepšení o 0.2675 procent na zlepšení o 2.0125 procent. |