Current Approaches to Anonymizing Big Data in Hadoop
| Thesis title: | Současné přístupy k anonymizaci Big Dat v prostředí Hadoop |
|---|---|
| Author: | Heptnerová, Zuzana |
| Thesis type: | Diplomová práce |
| Supervisor: | Karkošková, Soňa |
| Opponents: | Augustín, Jakub |
| Thesis language: | Česky |
| Abstract: | Diplomová práce se zabývá problematikou anonymizace dat s využitím nástrojů frameworku Apache Hadoop. Hlavním cílem je tvorba anonymizované tabulky za pomoci oblíbeného konceptu k-anonymity. Dílčím cílem je popsání specifik aplikace na datovou sadu s českými údaji. V teoretické části naleznete úvod do problematiky. Konkrétně jsou zde objasněny typy zveřejňovaných dat, typ proměnných, rizika reidentifikace, metody anonymizace a stručně popsán pojem Big Data. Praktická část se věnuje implementaci daného řešení na uměle vytvořenou datovou sadu s českými hodnotami. |
| Keywords: | Big Data; k-anonymity; GDPR; Apache Hadoop; Anonymizace |
| Thesis title: | Current Approaches to Anonymizing Big Data in Hadoop |
|---|---|
| Author: | Heptnerová, Zuzana |
| Thesis type: | Diploma thesis |
| Supervisor: | Karkošková, Soňa |
| Opponents: | Augustín, Jakub |
| Thesis language: | Česky |
| Abstract: | The thesis deals with the issue of data anonymization using the tools of the Apache Hadoop framework. The main goal is to create an anonymized table using the popular concept of k-anonymity. The partial goal is to describe the specifics of the application on a data set with Czech data. In the theoretical part you will find an introduction to the issue. Specifically, there are explained types of published data, type of variables, risks of re-identification, methods of anonymization and briefly described the term Big Data. The practical part deals with the implementation of the given solution on an artificially created data set with Czech values. |
| Keywords: | k-anonymity; Big Data; Apache Hadoop; Anonymization; GDPR |
Information about study
| Study programme: | Aplikovaná informatika/Informační systémy a technologie |
|---|---|
| Type of study programme: | Magisterský studijní program |
| Assigned degree: | Ing. |
| Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
| Faculty: | Faculty of Informatics and Statistics |
| Department: | Department of Information Technologies |
Information on submission and defense
| Date of assignment: | 1. 11. 2018 |
|---|---|
| Date of submission: | 29. 4. 2019 |
| Date of defense: | 31. 5. 2019 |
| Identifier in the InSIS system: | https://insis.vse.cz/zp/67635/podrobnosti |