Datová kvalita v prostředí otevřených a propojitelných dat

Název práce: Datová kvalita v prostředí otevřených a propojitelných dat
Autor(ka) práce: Tomčová, Lucie
Typ práce: Diplomová práce
Vedoucí práce: Chlapek, Dušan
Oponenti práce: Kučera, Jan
Jazyk práce: Česky
Abstrakt:
Diplomová práce se zabývá datovou kvalitou v prostředí otevřených a propojitelných dat. Mezi cíle patří vymezení specifik datové kvality v tomto prostředí. Na specifika je nahlíženo zejména z pohledu dimenzí datové kvality (tj. vlastností dat, které v rámci datové kvality sledujeme) a možností jejich měření. Dále práce definuje vliv, který má na datovou kvalitu převod dat do propojitelné podoby, a to s přihlédnutím k možným rizikům a přínosům, které dále datovou kvalitu mohou ovlivňovat. Na základě stanovených dimenzí datové kvality, které jsou shledány jako relevantní pro prostředí otevřených a propojitelných dat, je sestaven seznam metrik, jež jsou verifikovány na reálných datech (otevřená propojitelná data publikována orgánem státní správy). Práce ukazuje na potřebu posouzení a řízení datové kvality s přihlédnutím k rozdílům, které se váží k tomuto specifickému prostředí. Zároveň práce nabízí možnosti dalšího zkoumání této problematiky a prezentuje navazující směry, kterými je možné ubírat se při teoretickém i praktickém rozvíjení tématu.
Klíčová slova: dimenze kvality dat; LOD; metriky kvality dat; propojitelná data; datová kvalita; OD; otevřená data
Název práce: Data quality on the context of open and linked data
Autor(ka) práce: Tomčová, Lucie
Typ práce: Diploma thesis
Vedoucí práce: Chlapek, Dušan
Oponenti práce: Kučera, Jan
Jazyk práce: Česky
Abstrakt:
The master thesis deals with data quality in the context of open and linked data. One of the goals is to define specifics of data quality in this context. The specifics are perceived mainly with orientation to data quality dimensions (i. e. data characteristics which we study in data quality) and possibilities of their measurement. The thesis also defines the effect on data quality that is connected with data transformation to linked data; the effect if defined with consideration to possible risks and benefits that can influence data quality. The list of metrics verified on real data (open linked data published by government institution) is composed for the data quality dimensions that are considered to be relevant in context of open and linked data. The thesis points to the need of recognition of differences that are specific in this context when assessing and managing data quality. At the same time, it offers possibilities for further study of this question and it presents subsequent directions for both theoretical and practical evolution of the topic.
Klíčová slova: data quality metrics; data quality dimensions; LOD; linked data; OD; open data; data quality

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 3. 4. 2014
Datum podání práce: 5. 12. 2014
Datum obhajoby: 2. 2. 2015
Identifikátor v systému InSIS: https://insis.vse.cz/zp/47481/podrobnosti

Soubory ke stažení

    Poslední aktualizace: