Practical use of natural language processing in education technology

Thesis title: Practical use of natural language processing in education technology
Author: Hartinger, Dominik
Thesis type: Diploma thesis
Supervisor: Novotný, Ota
Opponents: Bohlen, Turner
Thesis language: English
Abstract:
The main focus of this thesis is the development and integration of new functionalities based on natural language processing for Beagle Learning. Beagle Learning is a Boston-based education technology startup that developed its own educative methodology and is looking to improve the current production NLP API endpoint and extend its capabilities to support the needs of their production application that is being used by thousands of students. The main goal of this work was to analyze, design, develop and integrate the solution of three main tasks that were needed as features in the next planned versions of the Beagle application: -Question type classification -Question deduplication -Question Productivity Index scoring automation For these tasks, multiple NLP approaches were adopted and compared to discover the best solutions that would yield satisfactory results in terms of Beagle’s needs. The algorithms were developed and tested using data provided by the company, where some of the data needed to be manually tagged prior to the research work. The thesis consists of three main parts – firstly, a context has been provided for the reader to understand the matters and the approaches. Then, each of the respective tasks is introduced in its own research block, finally followed by the API implementation and integration testing chapter. As the result, the first two of the three tasks have been successfully completed and implemented. As for the QPI problem, series of challenges and limitations have been identified that will be helpful in the future attempts to find a solution.
Keywords: Application programing interface; Education technology; Python; Artificial neural networks; Natural language processing; Question Productivity Index; Machine learning; Deep learning; Semantic deduplication
Thesis title: Praktické využití zpracování přirozeného jazyka ve vzdělávací technologii
Author: Hartinger, Dominik
Thesis type: Diplomová práce
Supervisor: Novotný, Ota
Opponents: Bohlen, Turner
Thesis language: English
Abstract:
Hlavním záměrem této práce je vývoj a integrace nových funkcionalit založených na zpracování přirozeného jazyka pro Beagle Learning. Beagle Learning je Bostonský startup působící na poli vzdělávacích technologií, jenž vyvinul svou vlastní vzdělávací metodologii a rád by vylepšil svou momentální API odpovědnou za prediktivní úlohy nad textem tak, aby odpovídala nárokům na produkční aplikaci využívanou tisícovkami studentů. Klíčovým cílem bylo zanalyzovat, navrhnout, vyvinout a otestovat rozšiření, jež by řešilo tři hlavní požadavky na další plánované verze aplikace Beagle: - Klasifikace typu otázek - Deduplikace otázek - Automatizace ohodnocení dle Indexu produktivity otázek Pro vyplnění těchto úkolů bylo vyzkoušeno a porovnáno několik přístupů pro účel výběru nejvhodnějšího řešení pro požadavky Beagle. Algoritmy byli vyvinuty a otestovány s použitím dat dodaných společností, nicméně některá data bylo nutné manuálně ohodnotit. Práce sestává ze tří hlavních částí - po uvedení čtenáře do kontextu problematiky a přístupů k řešení následují postupy řešení jednotlivých úkolů, na které nakonec navazuje jejich implementace do API. Ve výsledku byla úspěšně nalezena a implementována řešení dva ze tří úkolů. Pro neúspěšný úkol s Indexem produktivity otázek bylo identifikováno několik problémů a výzev, což pomůže při budoucím hledání řešení.
Keywords: Zpracování přirozeného jazyka; Index produktivity otázek; Strojové účení; Hluboké učení; Umělé neuronové sítě; Sémantická deduplikace; API; Python; Vzdělávací technologie

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 1. 2. 2021
Date of submission: 4. 12. 2021
Date of defense: 21. 3. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/78861/podrobnosti

Files for download

    Last update: