Application of NLP in customer support
Thesis title: | Aplikace NLP v oblasti zákaznické podpory |
---|---|
Author: | Mäsiar, Daniel |
Thesis type: | Diplomová práce |
Supervisor: | Vencovský, Filip |
Opponents: | Lébl, Pavel |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá vytvořením NLP systému v jazyce Java a jeho následným nasazením do komerčního provozu ve společnosti RobZone. V práci autor prochází celý proces vývoje NLP systému včetně problematiky licenčních omezení, klasifikace textů, rozpoznávání pojmenovaných entit (NER) a integrace vytvořeného NLP systému do již existujícího informačního systému společnosti RobZone. Pro účely co nejlepších výsledků systému autor provádí porovnání třech textových klasifikačních algoritmů (naivní Bayesovský klasifikátor, neuronová síť a metoda podpůrných vektorů) na skutečných datech. Bayesovský klasifikátor je jakožto nejlépe fungující testovaný algoritmus následně použit v dalším postupu. Autor dále aplikuje vybrané metody NER (regulární výrazy, anotace, gazetteery) a úspěšně integruje vytvořený systém s informačním systémem společnosti RobZone v rámci testovacího provozu. |
Keywords: | NLP; bayesovský klasifikátor; email; klasifikace; neuronová síť; SVM; NER |
Thesis title: | Application of NLP in customer support |
---|---|
Author: | Mäsiar, Daniel |
Thesis type: | Diploma thesis |
Supervisor: | Vencovský, Filip |
Opponents: | Lébl, Pavel |
Thesis language: | Česky |
Abstract: | This thesis deals with the creation of NLP system in Java and its subsequent deployment into commercial operation at RobZone. In this work, the author is going through the whole process of NLP system development including licensing restrictions, text classification, named entity recognition (NER) and integration of the created NLP system with an existing RobZone information system. In a pursuit of best results, the author compares three different text classification algorithms (naive Bayesian classifier, neural network, and support vectors machine) on real provided data. The Bayesian classifier is then used as the best performing test algorithm further in the developed NLP system. The author also applies selected NER methods (regular expressions, annotations, gazetteers) and successfully integrates the created system with the RobZone information system. |
Keywords: | NLP; bayes classifier; classification; email; neural net; SVM; NER |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 1. 10. 2018 |
---|---|
Date of submission: | 22. 4. 2019 |
Date of defense: | 29. 5. 2019 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/67380/podrobnosti |