Security aspects in Big Data technology

Thesis title: Bezpečnostní aspekty technologie Big Data
Author: Zenkl, Lukáš
Thesis type: Diplomová práce
Supervisor: Čermák, Igor
Opponents: Hlaváč, Jindřich
Thesis language: Česky
Abstract:
Diplomová práce se zabývá bezpečnostními aspekty technologie Big Data. První kapitola se věnuje teoretickému rozboru vývoje a definici pojmu Big Data. Ve druhé kapitole jsou všeobecně rozebrány pojmy z oblasti informační bezpečnosti a dochází zde rovněž k jejich vztažení na řízení bezpečnosti informací v podnicích. Z těchto poznatků vychází následná třetí kapitola, ve které jsou analyzována bezpečnostní rizika v oblasti Big Data. Výsledná analýza obě témata spojuje a aplikuje je na technologii Apache Hadoop. Závěrem této kapitoly je doporučení vhodných bezpečnostních opatření pro minimalizaci rizik při ukládání a zpracování velkého objemu dat. V závěrečné části práce je vytvořen návrh implementace Hardware Security Modulu v prostředí Apache Hadoop. Hlavní motivací návrhu je zjednodušení samotné implementace tohoto zařízení tak, aby byl dostatečně bezpečný pro potřeby anonymizace dat, ale zároveň byl jednodušší než ostatní dostupné návrhy, které jsou pro svou přílišnou složitost vhodné pro komplexnější úlohy.
Keywords: informační bezpečnost; Big Data; HSM; Apache Hadoop; šifrování
Thesis title: Security aspects in Big Data technology
Author: Zenkl, Lukáš
Thesis type: Diploma thesis
Supervisor: Čermák, Igor
Opponents: Hlaváč, Jindřich
Thesis language: Česky
Abstract:
This master's thesis deals with the security aspects of Big Data technology. The first chapter is focused on a theoretical analysis of the development and definition of the term Big Data. In the second chapter, concepts in the field of information security are discussed and applied to the management of information security in companies. The following third chapter is based on these findings, in which the security risks in the area of Big Data are analyzed. The resulting analysis combines both topics and applies them to Apache Hadoop technology. The conclusion of this third chapter is a recommendation of appropriate security measures to minimize the risks of storing and processing large amounts of data. In the final part of the thesis, a proposal for the implementation of the Hardware Security Module in the Apache Hadoop environment is suggested. The main motivation of the proposal is to simplify the actual implementation of this device so that it is sufficiently secure for the needs of data anonymization, but at the same time, it is more streamlined than other available proposals which are due to their excessive complexity suitable for more complex tasks.
Keywords: Apache Hadoop; Big Data; encryption; HSM; information security

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 17. 6. 2019
Date of submission: 4. 5. 2020
Date of defense: 9. 6. 2020
Identifier in the InSIS system: https://insis.vse.cz/zp/70829/podrobnosti

Files for download

    Last update: