Data quality on the context of open and linked data
Thesis title: | Datová kvalita v prostředí otevřených a propojitelných dat |
---|---|
Author: | Tomčová, Lucie |
Thesis type: | Diplomová práce |
Supervisor: | Chlapek, Dušan |
Opponents: | Kučera, Jan |
Thesis language: | Česky |
Abstract: | Diplomová práce se zabývá datovou kvalitou v prostředí otevřených a propojitelných dat. Mezi cíle patří vymezení specifik datové kvality v tomto prostředí. Na specifika je nahlíženo zejména z pohledu dimenzí datové kvality (tj. vlastností dat, které v rámci datové kvality sledujeme) a možností jejich měření. Dále práce definuje vliv, který má na datovou kvalitu převod dat do propojitelné podoby, a to s přihlédnutím k možným rizikům a přínosům, které dále datovou kvalitu mohou ovlivňovat. Na základě stanovených dimenzí datové kvality, které jsou shledány jako relevantní pro prostředí otevřených a propojitelných dat, je sestaven seznam metrik, jež jsou verifikovány na reálných datech (otevřená propojitelná data publikována orgánem státní správy). Práce ukazuje na potřebu posouzení a řízení datové kvality s přihlédnutím k rozdílům, které se váží k tomuto specifickému prostředí. Zároveň práce nabízí možnosti dalšího zkoumání této problematiky a prezentuje navazující směry, kterými je možné ubírat se při teoretickém i praktickém rozvíjení tématu. |
Keywords: | dimenze kvality dat; LOD; metriky kvality dat; propojitelná data; datová kvalita; OD; otevřená data |
Thesis title: | Data quality on the context of open and linked data |
---|---|
Author: | Tomčová, Lucie |
Thesis type: | Diploma thesis |
Supervisor: | Chlapek, Dušan |
Opponents: | Kučera, Jan |
Thesis language: | Česky |
Abstract: | The master thesis deals with data quality in the context of open and linked data. One of the goals is to define specifics of data quality in this context. The specifics are perceived mainly with orientation to data quality dimensions (i. e. data characteristics which we study in data quality) and possibilities of their measurement. The thesis also defines the effect on data quality that is connected with data transformation to linked data; the effect if defined with consideration to possible risks and benefits that can influence data quality. The list of metrics verified on real data (open linked data published by government institution) is composed for the data quality dimensions that are considered to be relevant in context of open and linked data. The thesis points to the need of recognition of differences that are specific in this context when assessing and managing data quality. At the same time, it offers possibilities for further study of this question and it presents subsequent directions for both theoretical and practical evolution of the topic. |
Keywords: | data quality metrics; data quality dimensions; LOD; linked data; OD; open data; data quality |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 3. 4. 2014 |
---|---|
Date of submission: | 5. 12. 2014 |
Date of defense: | 2. 2. 2015 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/47481/podrobnosti |