Web application for foreign vocabulary learning based on cross-lingual etymological linked data

Thesis title: Web application for foreign vocabulary learning based on cross-lingual etymological linked data
Author: Dužij, Maxim
Thesis type: Diploma thesis
Supervisor: Svátek, Vojtěch
Opponents: Nguyen, Viet Bach
Thesis language: English
Abstract:
The thesis will focus on developing a web application that helps create a passive vocabulary in some foreign languages. This thesis plans to explore how the etymological relations between languages could be used to grow a user's passive vocabulary. Linked Data will be used as a source of word pairs. The thesis will measure how successfully such proposed word pairs could be learned based on the etymological knowledge graph, i.e., having common roots despite surface differences. The web application will use linked linguistic data as a database and some heuristic algorithms for better word ordering and a smoother learning process. The thesis will not include Linked Data database creation but will use an existing one. Data quality is a crucial requirement that can significantly affect the final evaluation. The application will provide a learn section where the user can pick word pairs that are worth learning and a test section where the user can test the knowledge. Based on the evaluation and the success rate provided by the web application, the thesis will try to investigate whether it is possible to grow a passive vocabulary in a foreign language based on etymological links between words in a foreign language and the words in language users already know. The work-in-progress name for the website is Linked Languages.
Keywords: Words etymology; Web application; Linguistic Linked Data
Thesis title: Webová aplikace pro rozvoj pasivní slovní zásoby na základě lingvistických propojených dat
Author: Dužij, Maxim
Thesis type: Diplomová práce
Supervisor: Svátek, Vojtěch
Opponents: Nguyen, Viet Bach
Thesis language: English
Abstract:
Diplomová práce se zaměří na vývoj webové aplikace, která pomůže tvořit pasivní slovní zásobu v cizím jazyce. Webová aplikace bude používat etymologicky propojená lingvistická data jako databázi a heuristický algoritmus pro řazení slov. Práce nebude zahrnovat vytvoření propojené databáze dat, ale bude využívat existující. Kvalita dat je zásadní požadavek, který může výrazně ovlivnit výsledné hodnocení. Aplikace poskytne výukovou sekci, kde si uživatel může vybrat dvojice slov, které stojí za to se naučit, a testovací sekci, kde své vědomosti může otestovat. Na základě vyhodnocení webové aplikace se diplomová práce pokusí prozkoumat, zda je možné plnit pasivní slovní zásobu v cizím jazyce na základě etymologických vazeb mezi slovy v cizím jazyce a slovy v jazyce, která již uživatelé znají. Docasné jméno projektu je Linked Languages.
Keywords: lingvistická propojená data; webová aplikace; rozvoj pasivní slovní zásoby

Information about study

Study programme: Znalostní a webové technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 6. 11. 2021
Date of submission: 2. 12. 2022
Date of defense: 23. 1. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/78671/podrobnosti

Files for download

    Last update: