Thesis title: |
Dátová analýza slovnej zásoby a sentimentu v anglickej literatúre ako pomôcka pri učení sa cudzieho jazyka |
Author: |
Majtas, Andrej |
Thesis type: |
Bachelor thesis |
Supervisor: |
Chudán, David |
Opponents: |
Strossa, Petr |
Thesis language: |
Slovensky |
Abstract: |
Cieľom bakalárskej práce je vytvoriť zoznam odporúčanej autentickej anglickej literatúry vhodnej pre študentov anglického jazyka, a to na základe analýzy slovnej zásoby a sentimentu textov. Literárne diela analyzované v práci pochádzajú z databázy Project Gutenberg, ktorá poskytuje voľne dostupné elektronické knihy. Práca využíva metódy spracovania prirodzeného jazyka (NLP), konkrétne frekvenčnú analýzu vo vzťahu k frekvenčným zoznamom slov NGSL a BNC/COCA, a metódou analýzy sentimentu založenej na slovníku. Okrem toho je aplikovaná metóda TF-IDF na identifikáciu charakteristických slov v žánroch ako science fiction, detektívne príbehy a zamilované príbehy. Výsledky práce môžu pomáhať určiť, ktoré literárne diela sú jazykovo dostupné, emocionálne pozitívne a teda vhodné na podporu motivácie a rozvoja slovnej zásoby u študentov angličtiny. |
Keywords: |
NLP; slovná zásoba; vysoko frekventované slová; analýza sentimentu; TF-IDF; čítanie v cudzom jazyku |
Thesis title: |
Dátová analýza slovnej zásoby a sentimentu v anglickej literatúre ako pomôcka pri učení sa cudzieho jazyka |
Author: |
Majtas, Andrej |
Thesis type: |
Bakalářská práce |
Supervisor: |
Chudán, David |
Opponents: |
Strossa, Petr |
Thesis language: |
Slovensky |
Abstract: |
Cílem bakalářské práce je vytvořit seznam doporučené autentické anglické literatury vhodné pro studenty anglického jazyka, a to na základě analýzy slovní zásoby a sentimentu textů. Literární díla analyzovaná v práci pocházejí z databáze Project Gutenberg, která poskytuje volně dostupné elektronické knihy. Práce využívá metody zpracování přirozeného jazyka (NLP), konkrétně frekvenční analýzu ve vztahu k frekvenčním seznamům slov NGSL a BNC/COCA, a metodu analýzy sentimentu založené na slovníku. Kromě toho je aplikována metoda TF-IDF na identifikaci charakteristických slov v žánrech jako science fiction, detektivní příběhy a zamilované příběhy. Výsledky práce mohou pomáhat určit, která literární díla jsou jazykově dostupná, emocionálně pozitivní a tedy vhodná na podporu motivace a rozvoje slovní zásoby u studentů angličtiny. |
Keywords: |
NLP; slovní zásoba; analýza sentimentu; čtení v cizím jazyce; vysoce frekventovaná slova; TF-IDF |
Thesis title: |
Data analysis of vocabulary and sentiment in English literature as a tool for foreign language learning |
Author: |
Majtas, Andrej |
Thesis type: |
Bachelor thesis |
Supervisor: |
Chudán, David |
Opponents: |
Strossa, Petr |
Thesis language: |
Slovensky |
Abstract: |
The aim of this bachelor's thesis is to compile a list of recommended authentic English literary works suitable for English language learners, based on vocabulary analysis and sentiment evaluation of the texts. The analyzed literary works are sourced from the Project Gutenberg database, which provides freely accessible electronic books. The thesis employs natural language processing (NLP) methods, specifically frequency analysis in relation to the frequency-based NGSL and BNC/COCA word lists, and lexicon-based sentiment analysis. In addition, the TF-IDF method is applied to identify characteristic words within literary genres such as science fiction, detective stories and love stories. This research helps identify which literary texts are linguistically accessible, emotionally positive, and thus suitable for supporting student motivation and vocabulary development in English language learning. |
Keywords: |
foreign language reading; NLP; sentiment analysis; TF-IDF; vocabulary; high-frequency words |
Information about study
Study programme: |
Aplikovaná informatika |
Type of study programme: |
Bakalářský studijní program |
Assigned degree: |
Bc. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: |
18. 11. 2024 |
Date of submission: |
12. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.