Application of text mining methods for analysis of users movie reviews

Thesis title: Použití text miningových metod pro analýzu uživatelských recenzí filmů
Author: Palatínus, Vojtěch
Thesis type: Bakalářská práce
Supervisor: Matějka, Martin
Opponents: Novotný, Ota
Thesis language: Česky
Abstract:
Tématem této práce je problematika spojená s potížemi, které nastávají při práci s nestrukturovanými daty. Konkrétně se zaměřuje na přeměnu nestrukturovaných dat na data strukturovaná pomocí technik text miningu a přiblížení teoretických poznatků v oblasti tzv. Big Data, strukturovaných, semistrukturovaných a nestrukturovaných dat. Cílem práce je ucelené představení problematiky nestrukturovaných dat, ukázat jejich přeměnu na data strukturovaná pomocí metod text miningu a na základě takto vydolovaných dat provést analýzu uživatelských recenzí filmů z webu Mezinárodní Internetové filmové databáze. Přínosem práce je přiblížit čtenáři problematiku nestrukturovaných dat a na praktické ukázce ukázat, jak lze využít text miningových metod při dolování relevantních informací z tohoto typu dat.
Keywords: Big Data; Text mining; Data; Nestrukturovaná data; Strukturovaná data; Semistrukturovaná data
Thesis title: Application of text mining methods for analysis of users movie reviews
Author: Palatínus, Vojtěch
Thesis type: Bachelor thesis
Supervisor: Matějka, Martin
Opponents: Novotný, Ota
Thesis language: Česky
Abstract:
The topic of this thesis is to define the challenges while working with the unstructured data. It focuses, specifically, on a transformation between unstructured and structured data using text mining methods and bringing the closer view on so-called Big Data phenomenon. The goal of this thesis is to introduce problems that occur when working with unstructured data, to show their transformation to structured data format using text mining methods and to perform analysis on user reviews published on the website of The Internet Movie Database from the mined data. The aim of this thesis is to familiarize the reader with the unstructured data and on the example demonstrate how to use text mining methods for mining relevant information from this type of data.
Keywords: Text mining; Data; Unstructured data; Structured data; Semistructured data; Big Data

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 1. 2. 2017
Date of submission: 30. 4. 2018
Date of defense: 15. 6. 2018
Identifier in the InSIS system: https://insis.vse.cz/zp/60891/podrobnosti

Files for download

    Last update: