Data quality on the context of open and linked data

Thesis title: Datová kvalita v prostředí otevřených a propojitelných dat
Author: Tomčová, Lucie
Thesis type: Diplomová práce
Supervisor: Chlapek, Dušan
Opponents: Kučera, Jan
Thesis language: Česky
Abstract:
Diplomová práce se zabývá datovou kvalitou v prostředí otevřených a propojitelných dat. Mezi cíle patří vymezení specifik datové kvality v tomto prostředí. Na specifika je nahlíženo zejména z pohledu dimenzí datové kvality (tj. vlastností dat, které v rámci datové kvality sledujeme) a možností jejich měření. Dále práce definuje vliv, který má na datovou kvalitu převod dat do propojitelné podoby, a to s přihlédnutím k možným rizikům a přínosům, které dále datovou kvalitu mohou ovlivňovat. Na základě stanovených dimenzí datové kvality, které jsou shledány jako relevantní pro prostředí otevřených a propojitelných dat, je sestaven seznam metrik, jež jsou verifikovány na reálných datech (otevřená propojitelná data publikována orgánem státní správy). Práce ukazuje na potřebu posouzení a řízení datové kvality s přihlédnutím k rozdílům, které se váží k tomuto specifickému prostředí. Zároveň práce nabízí možnosti dalšího zkoumání této problematiky a prezentuje navazující směry, kterými je možné ubírat se při teoretickém i praktickém rozvíjení tématu.
Keywords: dimenze kvality dat; LOD; metriky kvality dat; propojitelná data; datová kvalita; OD; otevřená data
Thesis title: Data quality on the context of open and linked data
Author: Tomčová, Lucie
Thesis type: Diploma thesis
Supervisor: Chlapek, Dušan
Opponents: Kučera, Jan
Thesis language: Česky
Abstract:
The master thesis deals with data quality in the context of open and linked data. One of the goals is to define specifics of data quality in this context. The specifics are perceived mainly with orientation to data quality dimensions (i. e. data characteristics which we study in data quality) and possibilities of their measurement. The thesis also defines the effect on data quality that is connected with data transformation to linked data; the effect if defined with consideration to possible risks and benefits that can influence data quality. The list of metrics verified on real data (open linked data published by government institution) is composed for the data quality dimensions that are considered to be relevant in context of open and linked data. The thesis points to the need of recognition of differences that are specific in this context when assessing and managing data quality. At the same time, it offers possibilities for further study of this question and it presents subsequent directions for both theoretical and practical evolution of the topic.
Keywords: data quality metrics; data quality dimensions; LOD; linked data; OD; open data; data quality

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 3. 4. 2014
Date of submission: 5. 12. 2014
Date of defense: 2. 2. 2015
Identifier in the InSIS system: https://insis.vse.cz/zp/47481/podrobnosti

Files for download

    Last update: