Data Quality and Effective Use of Registers of State Administration

Thesis title: Kvalita dat a efektivní využití rejstříků státní správy
Author: Rut, Lukáš
Thesis type: Diplomová práce
Supervisor: Chlapek, Dušan
Opponents: Jankech, Pavel
Thesis language: Česky
Abstract:
Diplomová práce se zabývá rejstříky státní správy především z hlediska kvality dat v nich obsažených. Cílem práce je analyzovat způsoby ověřování kvality dat a vhodnou metodu aplikovat na data v obchodním rejstříku. Dalším cílem, který logicky následuje, je analyzovat možnosti čištění a zvyšování kvality dat a navrhnout řešení pro zjištěné nesrovnalosti v rejstříku. Posledním cílem je analyzovat přístupy ke stanovení identifikátoru osob a vybrat vhodný klíč k identifikaci osob v registrech státní správy. Práce je rozdělena do několika částí. První část představuje úvod do problematiky registrů státní správy. Podrobněji rozebírá několik vybraných registrů především z hlediska dat, které nabízejí, a jejich aktualizace. Významným přínosem této části práce je rozbor legislativních změn, které vstoupí v platnost spuštěním čtyř základních registrů státní správy v polovině roku 2010. Pozornost je věnována především vlivu změn na kvalitu dat v rejstřících a na celkové možnosti využití poskytovaných dat. Další část se zabývá problematikou identifikátorů právnických i fyzických osob a navrhuje řešení pro data z rejstříků státní správy. Třetí část analyzuje možnosti, jak určit datovou kvalitu. Podrobně popsaná metoda data profiling je následně použita v rozsáhlé analýze kvality dat obsažených v obchodním rejstříku. Výstupem datové analýzy jsou správná metadata a informace o nepřesných údajích zapsaných v obchodním rejstříku. Poslední část rozebírá možnosti, jak problémy s datovou kvalitou řešit. Jsou navrženy a navzájem porovnány tři varianty řešení. Diplomová práce představuje ucelený materiál, jak řešit problémy při využívání dat obsažených v registrech státní správy. Navržená řešení a popsané postupy je však možné využít i v mnoha dalších projektech, které se zabývají datovou kvalitou.
Keywords: master data management; data governance; data profiling; čištění dat; identifikátor; identifikátor; identifikace; státní správa; obchodní rejstřík; rejstřík; registr
Thesis title: Data Quality and Effective Use of Registers of State Administration
Author: Rut, Lukáš
Thesis type: Diploma thesis
Supervisor: Chlapek, Dušan
Opponents: Jankech, Pavel
Thesis language: Česky
Abstract:
This diploma thesis deals with registers of state administration in term of data quality. The main objective is to analyze the ways how to evaluate data quality and to apply appropriate method to data in business register. Analysis of possibilities of data cleansing and data quality improving and proposal of solution of found inaccuracy in business register is another objective. The last goal of this paper is to analyze approaches how to set identifier of persons and to choose suitable key for identification of persons in registers of state administration. The thesis is divided into several parts. The first one includes introduction into the sphere of registers of state administration. It closely analyzes several selected registers especially in terms of which data contain and how they are updated. Description of legislation changes, which will come into operation in the middle of year 2010, is great contribution of this part. Special attention is dedicated to the impact of these changes from data quality point of view. Next part deals with problems of legal and physical entities identifiers. This section contains possible solution how to identify entities in data from registers. Third part analyzes ways how to determine data quality. Method called data profiling is closely described and applied to extensive data quality analysis of business register. Correct metadata and information about incorrect data are the outputs of this analysis. The last chapter deals with possibilities how to solve data quality problems. There are proposed and compared three variations of solution. The paper as a whole represents compact material how to solve problems with effective using of data contained in registers of state administration. Nevertheless, proposed solutions and described approaches can be used in many other projects which deal with data quality.
Keywords: master data management; data governance; data profiling; data cleansing; data quality; identifier; identification; state administration; register; business register

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 17. 1. 2009
Date of submission: 30. 6. 2009
Date of defense: 10. 9. 2009
Identifier in the InSIS system: https://insis.vse.cz/zp/18831/podrobnosti

Files for download

    Last update: