Textová analytika definic pojmů v bankovní společnosti

Název práce: Textová analytika definic pojmů v bankovní společnosti
Autor(ka) práce: Koucká, Pavlína
Typ práce: Diplomová práce
Vedoucí práce: Novotný, Ota
Oponenti práce: Pour, Jan
Jazyk práce: Česky
Abstrakt:
Diplomová práce se zabývá zpracováním textu, konkrétněji textovou analytikou a jejím přesnějším využitím. Je rozdělena do dvou základních částí. První část diplomové práce nejprve přibližuje možnosti zpracování textu, textovou analytiku a její příbuzné pojmy a vztahy mezi nimi. Je vysvětleno, co znamenají a čím se od sebe navzájem liší. Dále je představeno zadání a konkrétní data poskytnutá zadavatelskou firmou. Zadáním se rozumí přiřazení termínů ke konkrétním doménám na základě textové analytiky jejich definic. Aby tento úkol mohl být splněn, následně jsou představeny různé nástroje, které mohou být použity. V druhé části práce se nejprve vyzkouší tři vhodné nástroje pro přípravu dat. Jeden z nich je vybrán a následně použit i pro další zpracování, především pro následnou klasifikaci daných pojmů. Ve výsledku je u každého termínu určena procentuální náležitost až do tří konkrétních domén.
Klíčová slova: textová analytika; textová analýza; klasifikace; řízený slovník
Název práce: Text Analytics of of Terms by Using Definitions in a Banking Company
Autor(ka) práce: Koucká, Pavlína
Typ práce: Diploma thesis
Vedoucí práce: Novotný, Ota
Oponenti práce: Pour, Jan
Jazyk práce: Česky
Abstrakt:
Diploma thesis is focused on text processing, more specifically on text analytics and its practical use. The thesis is divided into two main sections. The first section of the thesis introduces the possibilities of text processing, text analytics and its related concepts and the relationships between them. It explains what they mean and how they differ from each other. Furthermore, the assignment and the specific data provided by interested company are presented. The assignment is to match terms to specific domains based on text analytics of their definitions. Various tools that can be used to accomplish this task are then presented. In the second section of the thesis, three suitable data preparation tools are tested. One of them is selected and used for further processing, being predominantly classification of the given concepts. As an outcome, the percentage relevance of up to three specific domains is determined for each term.
Klíčová slova: text analytics; classification; controlled vocabulary; text analysis

Informace o studiu

Studijní program / obor: Informační systémy a technologie/Business Intelligence
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 25. 1. 2022
Datum podání práce: 4. 5. 2022
Datum obhajoby: 30. 5. 2022
Identifikátor v systému InSIS: https://insis.vse.cz/zp/79438/podrobnosti

Soubory ke stažení

    Poslední aktualizace: