Možnosti ověření kvality otevřených dat

Název práce: Možnosti ověření kvality otevřených dat
Autor(ka) práce: Hájek, Štěpán
Typ práce: Bakalářská práce
Vedoucí práce: Chlapek, Dušan
Oponenti práce: Kučera, Jan
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zabývá problematikou ověřování kvality otevřených dat. Hlavním cílem práce je vyhodnocení kvality vybraných otevřených datových sad prostřednictvím technických kontrol a následná analýza identifikovaných nedostatků. V práci se nejdříve vymezují základní pojmy a dimenze datové kvality a poté se analyzují postupy a pravidla pro zajištění kvality dat v České republice a ve vybraných zahraničních zemích (Francii, Irsku a Španělsku). Následně je navrženo pět měřitelných metrik pokrývajících vybrané dimenze kvality dat, které jsou pomocí SQL skriptů aplikovány na tři datové sady z Národního katalogu otevřených dat. Výsledky analýzy odhalily významnou nekonzistenci v kvalitě dat, zejména chybovost u identifikátoru IČO. Na základě těchto zjištění jsou v závěru práce formulována konkrétní doporučení, která směřují ke zvýšení kvality publikovaných otevřených dat.
Klíčová slova: kvalita dat; SQL; otevřená data; dimenze datové kvality
Název práce: Methods for Verifying the Quality of Open Data
Autor(ka) práce: Hájek, Štěpán
Typ práce: Bachelor thesis
Vedoucí práce: Chlapek, Dušan
Oponenti práce: Kučera, Jan
Jazyk práce: Česky
Abstrakt:
This bachelor’s thesis addresses the issue of verifying the quality of open data. The main objective of the thesis is to evaluate the quality of selected open datasets through technical checks and to subsequently analyze the identified shortcomings. The thesis first defines basic concepts and dimensions of data quality, and then analyzes procedures and rules for ensuring data quality in the Czech Republic and in selected foreign countries (France, Ireland, and Spain). Subsequently, five measurable metrics covering selected dimensions of data quality are proposed, which are applied to three datasets from the National Open Data Catalog using SQL scripts. The results of the analysis revealed significant inconsistencies in data quality, particularly error rates in the IČO identifier. Based on these findings, the conclusion of the thesis formulates specific recommendations aimed at improving the quality of published open data.
Klíčová slova: data quality; open data; data quality dimension; SQL

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 2. 12. 2025
Datum podání práce: 11. 5. 2026
Datum obhajoby: 23. 6. 2026
Identifikátor v systému InSIS: https://insis.vse.cz/zp/94765/podrobnosti

Soubory ke stažení

    Poslední aktualizace: