The Evolution of Semantics and its Effect on Asset Prices

Thesis title: The Evolution of Semantics and its Effect on Asset Prices
Author: Matoušek, Martin
Thesis type: Diploma thesis
Supervisor: Fičura, Milan
Opponents: Vyletelka, Michal
Thesis language: English
Abstract:
Advances in natural language processing culminated in the advent of language models based on transformers that surpass even humans in certain language benchmarking tasks. Their domain-specific derivatives show promising results also when applied to financial texts. But research in this domain is sparse. Prior research works with former models, simple features and open-source data. This thesis proposes an approach of applying a language model on a large-scale custom-made dataset of financial news articles. This approach combines progress in machine learning, natural language processing and model interpretability to help better understand and estimate the effect of investor sentiment with regards to stock price forecasting. The proposed end-to-end approach can be utilized in a trading strategy that outperforms the market but suffers from high volatility. Experimental results show that sentiment extracted from articles influences next day returns, a relationship that is amplified by the length of the article.
Keywords: sentiment analysis; stock price prediction; language model
Thesis title: Vývoj sentimentu a jeho efekt na ceny aktiv
Author: Matoušek, Martin
Thesis type: Diplomová práce
Supervisor: Fičura, Milan
Opponents: Vyletelka, Michal
Thesis language: English
Abstract:
Pokrok v přirozeném zpracování jazyka vyvrcholil zrodem jazykových modelů na bázi trans- former architektury, které předčují dokonce i lidské schopnosti v některých jazykových bench-markových úkolech. Jejich deriváty, přizpůsobené specifickým odvětvím, představují slibné výsledky i při aplikacích na finanční texty. Rozsah výzkůmu je v této oblasti prozatím skromný. Předchozí práce využívají primárně dřívější metody, jednoduché jazykové proměnné a open-source data. Tato práce navrhuje metodu aplikace jazykového modelu na rozsáhlý dataset vytvořený na základě finančních článků. Tento přístup kombinuje pokrok v oblasti strojového učení, přirozeného zpracování jazyka a interpretability modelů pro lepší pochopení a aproximaci efektů sentimentu investorů s ohlednem na predikci cen akcíí. Navrhovaný postup může být využit ke konstrukci profitabilní obchodní strategie, která však disponuje vysokou volatilitou. Výsledky testů dokazují, že sentiment extrahovaný z finančních článků ovlivňuje výnosy dalšího dne. Tento vztah je zesílen délkou článku.
Keywords: analýza sentimentu; predikce cen akcií; jazykový model

Information about study

Study programme: Finance a účetnictví/Finance
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Finance and Accounting
Department: Department of Banking and Insurance

Information on submission and defense

Date of assignment: 6. 2. 2020
Date of submission: 15. 1. 2021
Date of defense: 4. 2. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/72407/podrobnosti

Files for download

    Last update: