Aspect-based sentiment analysis of conference review forms
Thesis title: | Aspect-based sentiment analysis of conference review forms |
---|---|
Author: | Juranková, Sára |
Thesis type: | Diploma thesis |
Supervisor: | Svátek, Vojtěch |
Opponents: | Vencovský, Filip |
Thesis language: | English |
Abstract: | The aim of this thesis is to create a system for extracting opinions and sentiment from conference paper reviews and group these opinions by the different criteria a paper is judged on. The theoretical part of the thesis describes the existing methods of sentiment analysis and natural language processing, thus providing necessary context. The reviewing process of conferences focused on semantic technology and the structure of the reviews are explored. A set of criteria is identified, based on the fields of different conference review forms and used as a foundation for the extraction of terms that are used to express these criteria. A sentiment lexicon is created specifically for the domain of conference paper reviews. In the practical section a dictionary-based sentiment lexicon analysis method is implemented and applied to a set of reviews from 3 different conferences. The results are then evaluated by comparing the numerical scores estimated by the algorithm with the numerical scores from the reviews. The outcome is then explored further, by inspecting the accuracy of criterion identification and sentiment analysis on a sentence level. The precision of criterion identification is evaluated at 57.38 % and the recall at 53.44 %, while the sentiment polarity is correct in over 75 % of cases. The rationale behind this outcome is explained and a set of recommendations is given for future improvements. |
Keywords: | sentiment analysis; conference submission reviews; aspect-based sentiment analysis |
Thesis title: | Aspektová analýza sentimentu recenzí konferenčních příspěvků |
---|---|
Author: | Juranková, Sára |
Thesis type: | Diplomová práce |
Supervisor: | Svátek, Vojtěch |
Opponents: | Vencovský, Filip |
Thesis language: | English |
Abstract: | Cílem této práce je vytvoření systému pro extrakci názorů a sentimentu z recenzí konferenčních příspěvků a seskupování těchto názoru podle kritérií, na základě kterých jsou tyto příspěvky posuzovány pro akceptaci. Teoretická část práce uvádí existující metody analýzy sentimentu a zpracování přirozeného jazyka. Následně prozkoumává strukturu recenzí z konferencí zaměřených na sémantické technologie a proces, kterým tyto recenze vznikají. Na základě struktury recenzních formulářů z různých konferencí je navržena obecná množina kritérií, která jsou v této práci vytvářeným systémem z recenzních textů extrahována. Ta pak slouží jako báze k extrakci výrazů, které je vyjadřují. Rovněž je vytvořen lexikon slov se sentimentovou polaritou, specifický pro konferenční recenze. Tento lexikon je následně využit pro implementaci metody analýzy sentimentu. Ta je následně aplikována na množinu recenzí ze tří různých konferencí. Výsledky numerických odhadů pro jednotlivá kritéria jsou porovnávány s vlastním číselným hodnocením autorů recenzí. Výstup systému je dále zkoumán na úrovni vět pro zjištění správnosti identifikace kritérií a polarity sentimentu. Výsledná přesnost implementovaného algoritmu při identifikaci kritérií vychází na 57.38 % a úplnost na 53.44 %, přičemž úspěšnost klasifikace sentimentu činí zhruba 75 %. Dosažené výsledky jsou zhodnoceny a jsou navržena doporučení pro budoucí zlepšení systému. |
Keywords: | recenze konferenčních příspěvků; aspektová analýza sentimentu; analýza sentimentu |
Information about study
Study programme: | Aplikovaná informatika/Znalostní a webové technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 12. 9. 2019 |
---|---|
Date of submission: | 5. 12. 2020 |
Date of defense: | 2. 2. 2021 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/70448/podrobnosti |