Big Data, their storage and options of exploitation

Thesis title: Big Data, jejich skladování a možnosti využití
Author: Macek, Jáchym
Thesis type: Bakalářská práce
Supervisor: Chlapek, Dušan
Opponents: Kučera, Jan
Thesis language: Česky
Abstract:
Obsah bakalářské práce analyzuje práci s daty, a to konkrétně s velkoobjemovými nestrukturalizovanými data, tedy Big Data. Práce je rešeršního charakteru, a obsahuje informační průzkum založený na dotaznících a rozhovorech. Cílem je zhodnocení a přiblížení tématu velkých dat, jejich skladování, nástrojů pro jejich správu a možností využití čtenáři, jak z technologického, tak obchodního pohledu. Cílem pro praktickou část práce je realizace průzkumu. Práce je rozdělena do tří hlavních částí. První část definuje pojem, podává užší pohled do problematiky a věnuje se otevřeným a propojitelným datům. Druhá část se zabývá otázkou skladování a možnostmi následného využití uskladněných dat, nástroji a technologiemi pro správu a práci s Big Data. Dále zhodnocení výhod a nevýhody a porovnání technologií Hadoop. Ve třetí části je zveřejněn průzkum o problematice Big Data. Používám metody dotazníků a rozhovorů pro získání informací od studentů a odborníků z praxe. Dále popisuje současné trendy, problémy a nabízí řešení z praxe.
Keywords: otevřená a propojitelná data; open-source; datová analýza; Hadoop; datový sklad; Big Data
Thesis title: Big Data, their storage and options of exploitation
Author: Macek, Jáchym
Thesis type: Bachelor thesis
Supervisor: Chlapek, Dušan
Opponents: Kučera, Jan
Thesis language: Česky
Abstract:
The content of this bachelor's thesis is to analyze work with data especially with large-volume unstructured data, thus Big Data. The thesis is retrieval and contents informational survey based on questionnaires and interviews. The aim is to evaluate and approximate Big Data theme, their storage, tools for their management and opportunities of its exploitation to the reader from technological and business point of view. The objective for the practical part is a survey. The thesis is divided in to three parts. The first part defines the concept, gives closer look at the issue and is dedicated to open and linked data. The second part deals with the question of storage and opportunities of subsequent exploitation of stored data, tools and technologies for Big Data management. Further, there is evaluation of the advantages and disadvantages and comparison of the Hadoop technologies. In the third part the survey of Big Data issue is published. I use tools of questionnaires and interviews for acquiring information from students and experts. Furthermore, it describes current trends, problems and offers solution from the field.
Keywords: open and linked data; open-source; data analysis; Hadoop; data storage; Big Data

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 28. 11. 2013
Date of submission: 10. 5. 2014
Date of defense: 19. 6. 2014
Identifier in the InSIS system: https://insis.vse.cz/zp/45693/podrobnosti

Files for download

    Last update: