The Evolution of Semantics and its Effect on Asset Prices
Thesis title: | The Evolution of Semantics and its Effect on Asset Prices |
---|---|
Author: | Matoušek, Martin |
Thesis type: | Diploma thesis |
Supervisor: | Fičura, Milan |
Opponents: | Vyletelka, Michal |
Thesis language: | English |
Abstract: | Advances in natural language processing culminated in the advent of language models based on transformers that surpass even humans in certain language benchmarking tasks. Their domain-specific derivatives show promising results also when applied to financial texts. But research in this domain is sparse. Prior research works with former models, simple features and open-source data. This thesis proposes an approach of applying a language model on a large-scale custom-made dataset of financial news articles. This approach combines progress in machine learning, natural language processing and model interpretability to help better understand and estimate the effect of investor sentiment with regards to stock price forecasting. The proposed end-to-end approach can be utilized in a trading strategy that outperforms the market but suffers from high volatility. Experimental results show that sentiment extracted from articles influences next day returns, a relationship that is amplified by the length of the article. |
Keywords: | sentiment analysis; stock price prediction; language model |
Thesis title: | Vývoj sentimentu a jeho efekt na ceny aktiv |
---|---|
Author: | Matoušek, Martin |
Thesis type: | Diplomová práce |
Supervisor: | Fičura, Milan |
Opponents: | Vyletelka, Michal |
Thesis language: | English |
Abstract: | Pokrok v přirozeném zpracování jazyka vyvrcholil zrodem jazykových modelů na bázi trans- former architektury, které předčují dokonce i lidské schopnosti v některých jazykových bench-markových úkolech. Jejich deriváty, přizpůsobené specifickým odvětvím, představují slibné výsledky i při aplikacích na finanční texty. Rozsah výzkůmu je v této oblasti prozatím skromný. Předchozí práce využívají primárně dřívější metody, jednoduché jazykové proměnné a open-source data. Tato práce navrhuje metodu aplikace jazykového modelu na rozsáhlý dataset vytvořený na základě finančních článků. Tento přístup kombinuje pokrok v oblasti strojového učení, přirozeného zpracování jazyka a interpretability modelů pro lepší pochopení a aproximaci efektů sentimentu investorů s ohlednem na predikci cen akcíí. Navrhovaný postup může být využit ke konstrukci profitabilní obchodní strategie, která však disponuje vysokou volatilitou. Výsledky testů dokazují, že sentiment extrahovaný z finančních článků ovlivňuje výnosy dalšího dne. Tento vztah je zesílen délkou článku. |
Keywords: | analýza sentimentu; predikce cen akcií; jazykový model |
Information about study
Study programme: | Finance a účetnictví/Finance |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Finance and Accounting |
Department: | Department of Banking and Insurance |
Information on submission and defense
Date of assignment: | 6. 2. 2020 |
---|---|
Date of submission: | 15. 1. 2021 |
Date of defense: | 4. 2. 2021 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/72407/podrobnosti |