Application of text mining methods for analysis of users movie reviews
Thesis title: | Použití text miningových metod pro analýzu uživatelských recenzí filmů |
---|---|
Author: | Palatínus, Vojtěch |
Thesis type: | Bakalářská práce |
Supervisor: | Matějka, Martin |
Opponents: | Novotný, Ota |
Thesis language: | Česky |
Abstract: | Tématem této práce je problematika spojená s potížemi, které nastávají při práci s nestrukturovanými daty. Konkrétně se zaměřuje na přeměnu nestrukturovaných dat na data strukturovaná pomocí technik text miningu a přiblížení teoretických poznatků v oblasti tzv. Big Data, strukturovaných, semistrukturovaných a nestrukturovaných dat. Cílem práce je ucelené představení problematiky nestrukturovaných dat, ukázat jejich přeměnu na data strukturovaná pomocí metod text miningu a na základě takto vydolovaných dat provést analýzu uživatelských recenzí filmů z webu Mezinárodní Internetové filmové databáze. Přínosem práce je přiblížit čtenáři problematiku nestrukturovaných dat a na praktické ukázce ukázat, jak lze využít text miningových metod při dolování relevantních informací z tohoto typu dat. |
Keywords: | Big Data; Text mining; Data; Nestrukturovaná data; Strukturovaná data; Semistrukturovaná data |
Thesis title: | Application of text mining methods for analysis of users movie reviews |
---|---|
Author: | Palatínus, Vojtěch |
Thesis type: | Bachelor thesis |
Supervisor: | Matějka, Martin |
Opponents: | Novotný, Ota |
Thesis language: | Česky |
Abstract: | The topic of this thesis is to define the challenges while working with the unstructured data. It focuses, specifically, on a transformation between unstructured and structured data using text mining methods and bringing the closer view on so-called Big Data phenomenon. The goal of this thesis is to introduce problems that occur when working with unstructured data, to show their transformation to structured data format using text mining methods and to perform analysis on user reviews published on the website of The Internet Movie Database from the mined data. The aim of this thesis is to familiarize the reader with the unstructured data and on the example demonstrate how to use text mining methods for mining relevant information from this type of data. |
Keywords: | Text mining; Data; Unstructured data; Structured data; Semistructured data; Big Data |
Information about study
Study programme: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 1. 2. 2017 |
---|---|
Date of submission: | 30. 4. 2018 |
Date of defense: | 15. 6. 2018 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/60891/podrobnosti |