Použití text miningových metod pro analýzu uživatelských recenzí filmů
Název práce: | Použití text miningových metod pro analýzu uživatelských recenzí filmů |
---|---|
Autor(ka) práce: | Palatínus, Vojtěch |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Matějka, Martin |
Oponenti práce: | Novotný, Ota |
Jazyk práce: | Česky |
Abstrakt: | Tématem této práce je problematika spojená s potížemi, které nastávají při práci s nestrukturovanými daty. Konkrétně se zaměřuje na přeměnu nestrukturovaných dat na data strukturovaná pomocí technik text miningu a přiblížení teoretických poznatků v oblasti tzv. Big Data, strukturovaných, semistrukturovaných a nestrukturovaných dat. Cílem práce je ucelené představení problematiky nestrukturovaných dat, ukázat jejich přeměnu na data strukturovaná pomocí metod text miningu a na základě takto vydolovaných dat provést analýzu uživatelských recenzí filmů z webu Mezinárodní Internetové filmové databáze. Přínosem práce je přiblížit čtenáři problematiku nestrukturovaných dat a na praktické ukázce ukázat, jak lze využít text miningových metod při dolování relevantních informací z tohoto typu dat. |
Klíčová slova: | Big Data; Text mining; Data; Nestrukturovaná data; Strukturovaná data; Semistrukturovaná data |
Název práce: | Application of text mining methods for analysis of users movie reviews |
---|---|
Autor(ka) práce: | Palatínus, Vojtěch |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Matějka, Martin |
Oponenti práce: | Novotný, Ota |
Jazyk práce: | Česky |
Abstrakt: | The topic of this thesis is to define the challenges while working with the unstructured data. It focuses, specifically, on a transformation between unstructured and structured data using text mining methods and bringing the closer view on so-called Big Data phenomenon. The goal of this thesis is to introduce problems that occur when working with unstructured data, to show their transformation to structured data format using text mining methods and to perform analysis on user reviews published on the website of The Internet Movie Database from the mined data. The aim of this thesis is to familiarize the reader with the unstructured data and on the example demonstrate how to use text mining methods for mining relevant information from this type of data. |
Klíčová slova: | Text mining; Data; Unstructured data; Structured data; Semistructured data; Big Data |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 1. 2. 2017 |
---|---|
Datum podání práce: | 30. 4. 2018 |
Datum obhajoby: | 15. 6. 2018 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/60891/podrobnosti |