Data Catalogue and Data Quality

Thesis title: Datová kvalita a datové katalogy
Author: Lukšík, Marek
Thesis type: Diplomová práce
Supervisor: Rauch, Jan
Opponents: Vojíř, Stanislav
Thesis language: Česky
Abstract:
Datový management se stal pro mnohé společnosti tématem číslo jedna, a to hlavně kvůli potřebě využívat data pro získání konkurenční výhody. Ve stejné chvíli ovšem mnoho společností trpí na nedořešenou obchodní architekturu, neefektivní obchodní procesy, či nízký integrační stupeň u IT aplikací. To vše má negativní dopad na datovou kvalitu, která determinuje, jak moc se lze spolehnout na výsledky spojené s datovou analýzou. Datová kvalita je vnímána u převážné většiny společností jako překážka ke spolehlivému využívání dat v obchodním rozhodování, a proto v dnešních dnech dochází k masivním revizím jak obchodních procesů, tak portfolia IT aplikací. V rámci této revize se ukazuje, že společnou slabinou všech dat je nejasnost v životním cyklu, tedy jak data vznikají, kde se ukládají a jak se spravují. Tento fenomén dal vzniknout novému odvětví v rámci řízení dat, a to datovým katalogům. Jedná se o platformy, které pomáhají s implementací principů datového řízení, včetně datové kvality a nabízí koncovým uživatelům (konzumentům dat) funkcionalitu k rychlému vyhledání potřebných dat, ale i pochopení kontextu, v jakém se data ve společnosti používají. Nedílnou složkou poznání kontextu je i úroveň datové kvality jednotlivých dat, tedy mírou souladu mezi požadavky na datovou kvalitu a aktuálním stavem dat. Pro stanovování požadavků datové kvality existuje nespočet norem a referenčních rámců datové kvality. Má práce nabízí inovativní pohled na to, jak implementovat některé aspekty datové kvality pomocí datového katalogu, systému LISp-Miner a konceptu obchodních pravidel. Zároveň analyzuje trh a porovnává jednotlivá řešení datových katalogů a přináší vhled do stavu v rámci velkých korporací a jejich vnímání, což je dnes z pohledu řízení dat klíčové.
Keywords: životní cyklus dat; referenční rámec; obchodní pravidla; datová kvalita; řízení dat; Datový katalog
Thesis title: Data Catalogue and Data Quality
Author: Lukšík, Marek
Thesis type: Diploma thesis
Supervisor: Rauch, Jan
Opponents: Vojíř, Stanislav
Thesis language: Česky
Abstract:
Data management becomes nowadays topic number one in many corporations as data is being seen as asset for protentional competitive advantage. At the same time many corporations are dealing with incomplete enterprise architecture, low quality business processes or low integration factor of IT applications. All these aspects do have a negative impact on data quality which determines the reliability of outcomes produced based on such data. Data quality is seen by many corporations as obstacle allowing to use data as a reliable input for business decisions. Hence in these days are flowing significant budgets into the review of business process and IT applications. In the reviews shows up a common denominator for all corporations – unclarity in data lifecycle. That means where is data originated, stored and handled. This phenomenon has given impulse for creation of additional area in data management – so called data catalogs. Data catalog is a platform helping the corporations with implementation of data management principles, including data quality and gives to the end consumers (data citizens) functionality for fast finding of data of interest together with a context description in which the data is used for. Data quality is counted as an integral part of context description. In other words, data quality is measuring the fitness of data for use. In these days many reference frameworks and standards exist to derive the data quality requirements. My theses provide an innovative approach on the integration of data catalogue, LISp-Miner and concept of business rules. At the same time analyses the market with data catalog solutions, provides the comparison and insight into the status qua of big corporations in sense of data management maturity.
Keywords: Data catalogue; data quality; data lifecycle; reference framework; business rules

Information about study

Study programme: Aplikovaná informatika/Podniková informatika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 7. 6. 2018
Date of submission: 7. 12. 2020
Date of defense: 3. 2. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/66140/podrobnosti

Files for download

    Last update: