Dátová analýza slovnej zásoby a sentimentu v anglickej literatúre ako pomôcka pri učení sa cudzieho jazyka
Autor(ka) práce:
Majtas, Andrej
Typ práce:
Bakalářská práce
Vedoucí práce:
Chudán, David
Oponenti práce:
Strossa, Petr
Jazyk práce:
Slovensky
Abstrakt:
Cieľom bakalárskej práce je vytvoriť zoznam odporúčanej autentickej anglickej literatúry vhodnej pre študentov anglického jazyka, a to na základe analýzy slovnej zásoby a sentimentu textov. Literárne diela analyzované v práci pochádzajú z databázy Project Gutenberg, ktorá poskytuje voľne dostupné elektronické knihy. Práca využíva metódy spracovania prirodzeného jazyka (NLP), konkrétne frekvenčnú analýzu vo vzťahu k frekvenčným zoznamom slov NGSL a BNC/COCA, a metódou analýzy sentimentu založenej na slovníku. Okrem toho je aplikovaná metóda TF-IDF na identifikáciu charakteristických slov v žánroch ako science fiction, detektívne príbehy a zamilované príbehy. Výsledky práce môžu pomáhať určiť, ktoré literárne diela sú jazykovo dostupné, emocionálne pozitívne a teda vhodné na podporu motivácie a rozvoja slovnej zásoby u študentov angličtiny.
Klíčová slova:
NLP; slovná zásoba; vysoko frekventované slová; analýza sentimentu; TF-IDF; čítanie v cudzom jazyku
Název práce:
Dátová analýza slovnej zásoby a sentimentu v anglickej literatúre ako pomôcka pri učení sa cudzieho jazyka
Autor(ka) práce:
Majtas, Andrej
Typ práce:
Bakalářská práce
Vedoucí práce:
Chudán, David
Oponenti práce:
Strossa, Petr
Jazyk práce:
Slovensky
Abstrakt:
Cílem bakalářské práce je vytvořit seznam doporučené autentické anglické literatury vhodné pro studenty anglického jazyka, a to na základě analýzy slovní zásoby a sentimentu textů. Literární díla analyzovaná v práci pocházejí z databáze Project Gutenberg, která poskytuje volně dostupné elektronické knihy. Práce využívá metody zpracování přirozeného jazyka (NLP), konkrétně frekvenční analýzu ve vztahu k frekvenčním seznamům slov NGSL a BNC/COCA, a metodu analýzy sentimentu založené na slovníku. Kromě toho je aplikována metoda TF-IDF na identifikaci charakteristických slov v žánrech jako science fiction, detektivní příběhy a zamilované příběhy. Výsledky práce mohou pomáhat určit, která literární díla jsou jazykově dostupná, emocionálně pozitivní a tedy vhodná na podporu motivace a rozvoje slovní zásoby u studentů angličtiny.
Klíčová slova:
NLP; slovní zásoba; analýza sentimentu; čtení v cizím jazyce; vysoce frekventovaná slova; TF-IDF
Název práce:
Data analysis of vocabulary and sentiment in English literature as a tool for foreign language learning
Autor(ka) práce:
Majtas, Andrej
Typ práce:
Bachelor thesis
Vedoucí práce:
Chudán, David
Oponenti práce:
Strossa, Petr
Jazyk práce:
Slovensky
Abstrakt:
The aim of this bachelor's thesis is to compile a list of recommended authentic English literary works suitable for English language learners, based on vocabulary analysis and sentiment evaluation of the texts. The analyzed literary works are sourced from the Project Gutenberg database, which provides freely accessible electronic books. The thesis employs natural language processing (NLP) methods, specifically frequency analysis in relation to the frequency-based NGSL and BNC/COCA word lists, and lexicon-based sentiment analysis. In addition, the TF-IDF method is applied to identify characteristic words within literary genres such as science fiction, detective stories and love stories. This research helps identify which literary texts are linguistically accessible, emotionally positive, and thus suitable for supporting student motivation and vocabulary development in English language learning.
Klíčová slova:
foreign language reading; NLP; sentiment analysis; TF-IDF; vocabulary; high-frequency words