Automatic detection of sensitive data for a global IT organisation

Thesis title: Automatická detekcia citlivých dát v nadnárodnej IT spoločnosti
Author: Grossertová, Ľubomíra
Thesis type: Diploma thesis
Supervisor: Umlauf, Miroslav
Opponents: Bartak, Vladimir
Thesis language: Slovensky
Abstract:
Citlivé dáta sú v dnešnej dobe čoraz viac spomínaným slovným spojením, ktoré ale pre väčšinu bežnej populácie predstavuje abstraktný pojem. Užívatelia a zákazníci rôznych IT firiem síce vedia, že existujú legislatívy a nariadenia, ako napríklad ochrana osobných údajov, ale v skutočnosti veľakrát nie je jasné, ako firma zaobchádza s ich údajmi. Na druhej strane globálne IT firmy pracujú s obrovským kvantom informácií, vrátane samozrejme aj tých senzitívnych, v ktorom je veľakrát ťažké sa zorientovať. Tým vzniká priestor pre automatickú detekciu, ktorá pomáha spoločnostiam pri riadení a správe dát v súlade s nariadeniami a reguláciami. Táto diplomová práca sa v úvode zaoberá vymedzením teoretického hľadiska z oblasti riadenia dát, legislatívou, reguláciami a takisto aj konkrétnym prípadom riadenia dát v cloudovom prostredí. Následne je prevedená analýza a zber dátových zdrojov vo firme, v ktorých sa bude aplikovať automatická detekcia citlivých údajov a samotné riešenie. Na záver je autorkou poskytnuté zhodnotenie priebehu riešenia a prínos práce.
Keywords: bezpečnosť údajov; citlivé dáta; automatická detekcia; strojové učenie; ochrana údajov; riadenie dát
Thesis title: Automatická detekce citlivých dat v nadnárodní IT společnosti
Author: Grossertová, Ľubomíra
Thesis type: Diplomová práce
Supervisor: Umlauf, Miroslav
Opponents: Bartak, Vladimir
Thesis language: Slovensky
Abstract:
Citlivé údaje jsou v dnešní době stále častěji zmiňovaným slovním spojením, ale pro většinu běžné populace se jedná o abstraktní pojem. Uživatelé a zákazníci různých IT společností sice vědí, že existují zákony a předpisy, například o ochraně osobních údajů, ale ve skutečnosti jim často není jasné, jak společnost s jejich daty zachází. Na druhou stranu globální IT společnosti pracují s obrovským množstvím informací, samozřejmě včetně citlivých informací, ve kterých je často obtížné se orientovat. Vzniká tak prostor pro automatizované zjišťování, které firmám pomůže spravovat a řídit data v souladu s předpisy a nařízeními. Tato práce začíná vymezením teoretického pohledu na oblast správy dat, legislativy a předpisů a zabývá se také konkrétním případem správy dat v cloudovém prostředí. Následně je provedena analýza a sběr datových zdrojů ve společnosti, kde bude aplikována automatická detekce citlivých dat a samotné řešení. V závěru je uvedeno zhodnocení postupu řešení a přínosu práce autorem.
Keywords: bezpečnost dat; citlivá data; automatická detekce; strojové učení; ochrana dat; správa dat
Thesis title: Automatic detection of sensitive data for a global IT organisation
Author: Grossertová, Ľubomíra
Thesis type: Diploma thesis
Supervisor: Umlauf, Miroslav
Opponents: Bartak, Vladimir
Thesis language: Slovensky
Abstract:
The growing conversation over "sensitive data" exposes a gap between the public's understanding and corporate realities. Users and customers of various IT companies may know that there are laws and regulations, such as General Data Protection Regulation (GDPR) etc., but it is often unclear how a company handles this data. On the other hand, global IT organisations deal with a huge amount of information, including sensitive information, that is often difficult to navigate. This creates an opportunity for automated discovery to help organisations manage and govern data in a compliant manner. This thesis starts by defining the theoretical perspective in the field of data governance, legislatives, regulations as well as a specific case of data management in a cloud environment. Subsequently, the analysis and collection of data sources in the company in which the automatic detection of sensitive data and the solution itself will be applied is carried out. Finally, a conclusion chapter contains an evaluation of the solution process and the contribution of the thesis.
Keywords: Sensitive Data; Automatic Detection; Machine Learning; Data Protection; Data Governance; Data Security

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 29. 9. 2023
Date of submission: 29. 4. 2024
Date of defense: 2024

Files for download

The files will be available after the defense of the thesis.

    Last update: