Current Approaches to Anonymizing Big Data in Hadoop

Thesis title: Současné přístupy k anonymizaci Big Dat v prostředí Hadoop
Author: Heptnerová, Zuzana
Thesis type: Diplomová práce
Supervisor: Karkošková, Soňa
Opponents: Augustín, Jakub
Thesis language: Česky
Abstract:
Diplomová práce se zabývá problematikou anonymizace dat s využitím nástrojů frameworku Apache Hadoop. Hlavním cílem je tvorba anonymizované tabulky za pomoci oblíbeného konceptu k-anonymity. Dílčím cílem je popsání specifik aplikace na datovou sadu s českými údaji. V teoretické části naleznete úvod do problematiky. Konkrétně jsou zde objasněny typy zveřejňovaných dat, typ proměnných, rizika reidentifikace, metody anonymizace a stručně popsán pojem Big Data. Praktická část se věnuje implementaci daného řešení na uměle vytvořenou datovou sadu s českými hodnotami.
Keywords: Big Data; k-anonymity; GDPR; Apache Hadoop; Anonymizace
Thesis title: Current Approaches to Anonymizing Big Data in Hadoop
Author: Heptnerová, Zuzana
Thesis type: Diploma thesis
Supervisor: Karkošková, Soňa
Opponents: Augustín, Jakub
Thesis language: Česky
Abstract:
The thesis deals with the issue of data anonymization using the tools of the Apache Hadoop framework. The main goal is to create an anonymized table using the popular concept of k-anonymity. The partial goal is to describe the specifics of the application on a data set with Czech data. In the theoretical part you will find an introduction to the issue. Specifically, there are explained types of published data, type of variables, risks of re-identification, methods of anonymization and briefly described the term Big Data. The practical part deals with the implementation of the given solution on an artificially created data set with Czech values.
Keywords: k-anonymity; Big Data; Apache Hadoop; Anonymization; GDPR

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 1. 11. 2018
Date of submission: 29. 4. 2019
Date of defense: 31. 5. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/67635/podrobnosti

Files for download

    Last update: