Analýza knihoven jazyka Python pro vývoj NLP aplikací

Název práce: Analýza knihoven jazyka Python pro vývoj NLP aplikací
Autor(ka) práce: Janeček, Antonio
Typ práce: Diplomová práce
Vedoucí práce: Vencovský, Filip
Oponenti práce: Bruckner, Tomáš
Jazyk práce: Česky
Abstrakt:
Python, jako nástroj pro zpracování NLP disponuje mnoha knihovnami, které zvládají různé úlohy po svém. Mají různé kvality, přednosti a nevýhody. Tato práce analyzuje zmíněné kvality pomocí kriteriálního schéma, navrženého s využitím dat, sesbíraných od oslovených odborníků. Struktura schématu čerpá ze zdrojů, uvedených v přehledu literatury a nabízí sedm hledisek hodnocení pro každou zařazenou knihovnu. Knihovny byly do výzkumu zařazeny po sesbírání dat z anonymního pracovního prostředí. Zůčastnilo se 77 různých respondentů přes vybrané dotazovací nástroje. Je popsán jejich přínos pro uživatele, který se rozhoduje tyto knihovny využít, nebo mezi nimi volí. Samotné závěry jsou z dat vyvozeny v diskuzi, kde autor srovnává situační využití všech zkoumaných nástrojů. Všechny knihovny, až na nástroj „DeepPavlov“, který byl vyřazen kvůli nedostatečnému vzorku nasbíraných odpovědí, jsou součástí finální analýzy. Vzestupně od nejméně po nejvíce bodů jsou knihovny seřazeny následovně: PyTorch, NLTK, PYNLPl, SpaCy, ChatterBot.
Klíčová slova: NLP; knihovny; PyTorch; Python; SpaCy; PyNLPl; NLTK; ChatterBot; Programování
Název práce: Analysis of Python libraries for NLP application development
Autor(ka) práce: Janeček, Antonio
Typ práce: Diploma thesis
Vedoucí práce: Vencovský, Filip
Oponenti práce: Bruckner, Tomáš
Jazyk práce: Česky
Abstrakt:
Python, as a tool for NLP processing, has many libraries that handle various tasks in their own way. They have different qualities, advantages and disadvantages. This work analyzes the mentioned qualities using a criteria scheme, designed using data collected from the addressed experts. The structure of the scheme draws on the sources listed in the literature review and offers seven evaluation aspects for each library included. Libraries were included in the research after collecting data from an anonymous work environment. 77 different respondents participated through selected survey tools. It describes their benefits for the user who decides to use these libraries or chooses between them. The conclusions themselves are drawn from the data in a discussion, where the author compares the situational use of all the tools examined. All libraries, except for the "DeepPavlov" tool, which was discarded due to an insufficient sample of collected responses, are part of the final analysis. Ascending from least to most points, the libraries are sorted as follows: PyTorch, NLTK, PYNLP1, SpaCy, ChatterBot.
Klíčová slova: NLP; libraries; SpaCy; PyNLPl; Programming; NLTK; Python; ChatterBot; PyTorch

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 1. 9. 2020
Datum podání práce: 4. 12. 2022
Datum obhajoby: 25. 1. 2023
Identifikátor v systému InSIS: https://insis.vse.cz/zp/76028/podrobnosti

Soubory ke stažení

    Poslední aktualizace: