Možnosti ověření kvality otevřených dat
| Název práce: | Možnosti ověření kvality otevřených dat |
|---|---|
| Autor(ka) práce: | Hájek, Štěpán |
| Typ práce: | Bakalářská práce |
| Vedoucí práce: | Chlapek, Dušan |
| Oponenti práce: | Kučera, Jan |
| Jazyk práce: | Česky |
| Abstrakt: | Tato bakalářská práce se zabývá problematikou ověřování kvality otevřených dat. Hlavním cílem práce je vyhodnocení kvality vybraných otevřených datových sad prostřednictvím technických kontrol a následná analýza identifikovaných nedostatků. V práci se nejdříve vymezují základní pojmy a dimenze datové kvality a poté se analyzují postupy a pravidla pro zajištění kvality dat v České republice a ve vybraných zahraničních zemích (Francii, Irsku a Španělsku). Následně je navrženo pět měřitelných metrik pokrývajících vybrané dimenze kvality dat, které jsou pomocí SQL skriptů aplikovány na tři datové sady z Národního katalogu otevřených dat. Výsledky analýzy odhalily významnou nekonzistenci v kvalitě dat, zejména chybovost u identifikátoru IČO. Na základě těchto zjištění jsou v závěru práce formulována konkrétní doporučení, která směřují ke zvýšení kvality publikovaných otevřených dat. |
| Klíčová slova: | kvalita dat; SQL; otevřená data; dimenze datové kvality |
| Název práce: | Methods for Verifying the Quality of Open Data |
|---|---|
| Autor(ka) práce: | Hájek, Štěpán |
| Typ práce: | Bachelor thesis |
| Vedoucí práce: | Chlapek, Dušan |
| Oponenti práce: | Kučera, Jan |
| Jazyk práce: | Česky |
| Abstrakt: | This bachelor’s thesis addresses the issue of verifying the quality of open data. The main objective of the thesis is to evaluate the quality of selected open datasets through technical checks and to subsequently analyze the identified shortcomings. The thesis first defines basic concepts and dimensions of data quality, and then analyzes procedures and rules for ensuring data quality in the Czech Republic and in selected foreign countries (France, Ireland, and Spain). Subsequently, five measurable metrics covering selected dimensions of data quality are proposed, which are applied to three datasets from the National Open Data Catalog using SQL scripts. The results of the analysis revealed significant inconsistencies in data quality, particularly error rates in the IČO identifier. Based on these findings, the conclusion of the thesis formulates specific recommendations aimed at improving the quality of published open data. |
| Klíčová slova: | data quality; open data; data quality dimension; SQL |
Informace o studiu
| Studijní program / obor: | Aplikovaná informatika |
|---|---|
| Typ studijního programu: | Bakalářský studijní program |
| Přidělovaná hodnost: | Bc. |
| Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
| Fakulta: | Fakulta informatiky a statistiky |
| Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
| Datum zadání práce: | 2. 12. 2025 |
|---|---|
| Datum podání práce: | 11. 5. 2026 |
| Datum obhajoby: | 23. 6. 2026 |
| Identifikátor v systému InSIS: | https://insis.vse.cz/zp/94765/podrobnosti |