Deanonymizace otevřených dat o kriminalitě
Název práce: | Deanonymizace otevřených dat o kriminalitě |
---|---|
Autor(ka) práce: | Fuka, Dominik |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Kučera, Jan |
Oponenti práce: | Chlapek, Dušan |
Jazyk práce: | Česky |
Abstrakt: | Práce se zabývá deanonymizací otevřených dat o kriminalitě. K publikování otevřených dat přistupuje stále více vládních organizací. Data jsou před zveřejněním anonymizována, aby nedocházelo k úniku citlivých informací. Tento proces lze však různými metodami obrátit a získat tak zpětně údaje o subjektu dat. Na základě této problematiky byly stanoveny cíle této práce. Prvním z nich bylo zdokumentování současného stavu publikace otevřených dat o kriminalitě v Austrálii, Evropské Unii, Kanadě, Novém Zélandu, Spojeném království Velké Británie a Severního Irska a Spojených státech amerických. Ke splnění tohoto cíle byla využita rešerše a analýza dostupných zdrojů. Druhým cílem bylo zanalyzovat různé způsoby a metody pro deanonymizaci dat, k čemuž bylo využito dostupné literatury a její následná analýza. Posledním cílem bylo otestování deanonymizace na reálné datové sadě. Nejprve byla vybrána vhodná datová sada – data o trestné činnosti v oblasti Avon a Somerset (Velká Británie) z března 2021 publikována Police UK – a následně související zdroje pro nalezení možných subjektů dat o trestných činech – Bristol Live a Somerset Live. V diskusi byl probrán rozdíl mezi manuálním a automatizovaným přístupem k deanonymizaci a výsledky byly zasazeny do kontextu současného stavu vědění. Přínosy práce spočívají v poskytnutí náhledu na publikování otevřených dat o kriminalitě ve význačných územních celcích a státech, dále pak práce poskytuje vybrané metody deanonymizace, a nakonec i názornou ukázku reidentifikace na reálné datové sadě. |
Klíčová slova: | otevřená data; deanonymizace; kriminalita; otevřená data o kriminalitě |
Název práce: | Crime open data deanonymization |
---|---|
Autor(ka) práce: | Fuka, Dominik |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Kučera, Jan |
Oponenti práce: | Chlapek, Dušan |
Jazyk práce: | Česky |
Abstrakt: | The thesis deals with the topic of crime open data deanonymization. Many government organizations publish open data or are at least considering it. Before publication, the data is anonymized to prevent sensitive information leaks. Nevertheless, various methods can reverse this process and recover sensitive information about the data owner. Objectives of this paper have been set regarding this issue. The first objective was to document the current state of crime open data publication in Australia, the European Union, Canada, New Zealand, the United Kingdom of Great Britain and Northern Ireland, and the United States of America. Research and analysis of available sources were used to fulfill this objective. The second objective was to analyze the different ways and methods for data deanonymization. Analysis of available literature was used to meet this objective. The final objective was to perform deanonymization on a real-world dataset. A suitable dataset was selected, which comes from the Avon and Somerset area in the United Kingdom and covers crime data from March 2021, as well as related sources to find the possible owners of the crime data - Bristol Live and Somerset Live. The discussion at the end of the paper goes into the difference between manual and automated approaches to deanonymization. The results were also put in the context of the current state of knowledge. The contributions of this thesis are to provide insight into the crime open data publications around the world, describe a few selected methods of deanonymization, and finally, give an example of re-identification done on a real-world dataset. |
Klíčová slova: | open data; deanonymization; re-identification; criminality; crime open data |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 12. 9. 2022 |
---|---|
Datum podání práce: | 8. 5. 2023 |
Datum obhajoby: | 22. 6. 2023 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/81450/podrobnosti |