Srovnání platforem pro text mining

Název práce: Srovnání platforem pro text mining
Autor(ka) práce: Tran, Tuan Anh
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Sklenák, Vilém
Jazyk práce: Česky
Abstrakt:
Hlavním cílem této bakalářské práce je porovnat volně dostupné platformy pro text mining pomocí vícekriteriální analýzy a doporučit vybraný nástroj nebo nástroje dalším uživatelům, kteří se rozhodnou pracovat v této oblasti. Pro dosažení daného cíle je potřeba porozumět okruhu text miningu v širším kontextu, jak z hlediska teoretického, tak i historického. Teoretická část se zabývá definičním vymezením pojmu text mining, jeho historií od počátků až po budoucí vyhlídky. Následně jsou podrobně popsány aplikace a procesy text miningu. Praktická část začíná popisem výběru platforem, představením použitých datasetů, seznámením s metodou srovnání platforem, způsobem rozdělení a váhou kritérií. Následně jsou srovnány platformy za pomocí vybraných datasetů a kritérií.
Klíčová slova: Dobývání z textu; RapidMiner; KNIME; IBM SPSS Modeler; Vícekriteriální kritéria
Název práce: Comparison of text mining platforms
Autor(ka) práce: Tran, Tuan Anh
Typ práce: Bachelor thesis
Vedoucí práce: Chudán, David
Oponenti práce: Sklenák, Vilém
Jazyk práce: Česky
Abstrakt:
The main objective of this bachelor thesis is to compare freely available text mining platforms using multi-criteria analysis and recommend the selected tool or tools to other users who decide to work in this field. To achieve this goal, it is necessary to understand the field of text mining in a broader context, both in terms of theory and history. In the theoretical part of the thesis, we have a definition of the term text mining, its historical origins to prospects. A detailed descriptions of the applications and processes of text mining are covered. The practical part of the thesis starts with a description of the selected platforms, introducing of the datasets used, introducing the method of comparing platforms, the distribution method and the weighting criteria used as well. Subsequently, the platforms were compared using the selected datasets and criteria.
Klíčová slova: IBM SPSS Modeler; RapidMiner; KNIME; Text mining; Multicriteria Analysis

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 16. 9. 2021
Datum podání práce: 8. 5. 2023
Datum obhajoby: 21. 6. 2023
Identifikátor v systému InSIS: https://insis.vse.cz/zp/77779/podrobnosti

Soubory ke stažení

    Poslední aktualizace: