Analýza knihoven jazyka Python pro vývoj NLP aplikací
Název práce: | Analýza knihoven jazyka Python pro vývoj NLP aplikací |
---|---|
Autor(ka) práce: | Janeček, Antonio |
Typ práce: | Diplomová práce |
Vedoucí práce: | Vencovský, Filip |
Oponenti práce: | Bruckner, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | Python, jako nástroj pro zpracování NLP disponuje mnoha knihovnami, které zvládají různé úlohy po svém. Mají různé kvality, přednosti a nevýhody. Tato práce analyzuje zmíněné kvality pomocí kriteriálního schéma, navrženého s využitím dat, sesbíraných od oslovených odborníků. Struktura schématu čerpá ze zdrojů, uvedených v přehledu literatury a nabízí sedm hledisek hodnocení pro každou zařazenou knihovnu. Knihovny byly do výzkumu zařazeny po sesbírání dat z anonymního pracovního prostředí. Zůčastnilo se 77 různých respondentů přes vybrané dotazovací nástroje. Je popsán jejich přínos pro uživatele, který se rozhoduje tyto knihovny využít, nebo mezi nimi volí. Samotné závěry jsou z dat vyvozeny v diskuzi, kde autor srovnává situační využití všech zkoumaných nástrojů. Všechny knihovny, až na nástroj „DeepPavlov“, který byl vyřazen kvůli nedostatečnému vzorku nasbíraných odpovědí, jsou součástí finální analýzy. Vzestupně od nejméně po nejvíce bodů jsou knihovny seřazeny následovně: PyTorch, NLTK, PYNLPl, SpaCy, ChatterBot. |
Klíčová slova: | NLP; knihovny; PyTorch; Python; SpaCy; PyNLPl; NLTK; ChatterBot; Programování |
Název práce: | Analysis of Python libraries for NLP application development |
---|---|
Autor(ka) práce: | Janeček, Antonio |
Typ práce: | Diploma thesis |
Vedoucí práce: | Vencovský, Filip |
Oponenti práce: | Bruckner, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | Python, as a tool for NLP processing, has many libraries that handle various tasks in their own way. They have different qualities, advantages and disadvantages. This work analyzes the mentioned qualities using a criteria scheme, designed using data collected from the addressed experts. The structure of the scheme draws on the sources listed in the literature review and offers seven evaluation aspects for each library included. Libraries were included in the research after collecting data from an anonymous work environment. 77 different respondents participated through selected survey tools. It describes their benefits for the user who decides to use these libraries or chooses between them. The conclusions themselves are drawn from the data in a discussion, where the author compares the situational use of all the tools examined. All libraries, except for the "DeepPavlov" tool, which was discarded due to an insufficient sample of collected responses, are part of the final analysis. Ascending from least to most points, the libraries are sorted as follows: PyTorch, NLTK, PYNLP1, SpaCy, ChatterBot. |
Klíčová slova: | NLP; libraries; SpaCy; PyNLPl; Programming; NLTK; Python; ChatterBot; PyTorch |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 1. 9. 2020 |
---|---|
Datum podání práce: | 4. 12. 2022 |
Datum obhajoby: | 25. 1. 2023 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/76028/podrobnosti |