Application of NLP in customer support

Thesis title: Aplikace NLP v oblasti zákaznické podpory
Author: Mäsiar, Daniel
Thesis type: Diplomová práce
Supervisor: Vencovský, Filip
Opponents: Lébl, Pavel
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá vytvořením NLP systému v jazyce Java a jeho následným nasazením do komerčního provozu ve společnosti RobZone. V práci autor prochází celý proces vývoje NLP systému včetně problematiky licenčních omezení, klasifikace textů, rozpoznávání pojmenovaných entit (NER) a integrace vytvořeného NLP systému do již existujícího informačního systému společnosti RobZone. Pro účely co nejlepších výsledků systému autor provádí porovnání třech textových klasifikačních algoritmů (naivní Bayesovský klasifikátor, neuronová síť a metoda podpůrných vektorů) na skutečných datech. Bayesovský klasifikátor je jakožto nejlépe fungující testovaný algoritmus následně použit v dalším postupu. Autor dále aplikuje vybrané metody NER (regulární výrazy, anotace, gazetteery) a úspěšně integruje vytvořený systém s informačním systémem společnosti RobZone v rámci testovacího provozu.
Keywords: NLP; bayesovský klasifikátor; email; klasifikace; neuronová síť; SVM; NER
Thesis title: Application of NLP in customer support
Author: Mäsiar, Daniel
Thesis type: Diploma thesis
Supervisor: Vencovský, Filip
Opponents: Lébl, Pavel
Thesis language: Česky
Abstract:
This thesis deals with the creation of NLP system in Java and its subsequent deployment into commercial operation at RobZone. In this work, the author is going through the whole process of NLP system development including licensing restrictions, text classification, named entity recognition (NER) and integration of the created NLP system with an existing RobZone information system. In a pursuit of best results, the author compares three different text classification algorithms (naive Bayesian classifier, neural network, and support vectors machine) on real provided data. The Bayesian classifier is then used as the best performing test algorithm further in the developed NLP system. The author also applies selected NER methods (regular expressions, annotations, gazetteers) and successfully integrates the created system with the RobZone information system.
Keywords: NLP; bayes classifier; classification; email; neural net; SVM; NER

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 1. 10. 2018
Date of submission: 22. 4. 2019
Date of defense: 29. 5. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/67380/podrobnosti

Files for download

    Last update: