Srovnání platforem pro text mining
Název práce: | Srovnání platforem pro text mining |
---|---|
Autor(ka) práce: | Tran, Tuan Anh |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Sklenák, Vilém |
Jazyk práce: | Česky |
Abstrakt: | Hlavním cílem této bakalářské práce je porovnat volně dostupné platformy pro text mining pomocí vícekriteriální analýzy a doporučit vybraný nástroj nebo nástroje dalším uživatelům, kteří se rozhodnou pracovat v této oblasti. Pro dosažení daného cíle je potřeba porozumět okruhu text miningu v širším kontextu, jak z hlediska teoretického, tak i historického. Teoretická část se zabývá definičním vymezením pojmu text mining, jeho historií od počátků až po budoucí vyhlídky. Následně jsou podrobně popsány aplikace a procesy text miningu. Praktická část začíná popisem výběru platforem, představením použitých datasetů, seznámením s metodou srovnání platforem, způsobem rozdělení a váhou kritérií. Následně jsou srovnány platformy za pomocí vybraných datasetů a kritérií. |
Klíčová slova: | Dobývání z textu; RapidMiner; KNIME; IBM SPSS Modeler; Vícekriteriální kritéria |
Název práce: | Comparison of text mining platforms |
---|---|
Autor(ka) práce: | Tran, Tuan Anh |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Sklenák, Vilém |
Jazyk práce: | Česky |
Abstrakt: | The main objective of this bachelor thesis is to compare freely available text mining platforms using multi-criteria analysis and recommend the selected tool or tools to other users who decide to work in this field. To achieve this goal, it is necessary to understand the field of text mining in a broader context, both in terms of theory and history. In the theoretical part of the thesis, we have a definition of the term text mining, its historical origins to prospects. A detailed descriptions of the applications and processes of text mining are covered. The practical part of the thesis starts with a description of the selected platforms, introducing of the datasets used, introducing the method of comparing platforms, the distribution method and the weighting criteria used as well. Subsequently, the platforms were compared using the selected datasets and criteria. |
Klíčová slova: | IBM SPSS Modeler; RapidMiner; KNIME; Text mining; Multicriteria Analysis |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 16. 9. 2021 |
---|---|
Datum podání práce: | 8. 5. 2023 |
Datum obhajoby: | 21. 6. 2023 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/77779/podrobnosti |