Managment of data quality and solving data quality problems

Thesis title: Řízení a řešení problémů kvality dat
Author: Vu, Duc Long
Thesis type: Bakalářská práce
Supervisor: Fortinová, Jana
Opponents: Vančo, Pavel
Thesis language: Česky
Abstract:
Tato bakalářská práce se zabývá tématem datové kvality a jejího řízení. Hlavním cílem práce je zlepšit kvalitu dat v malé firmě. Celá práce je rozdělena na dvě části. První polovina se zaměřuje na shrnutí teoretických poznatků v oblastí datové kvality a Data Governance. Teoretická část se věnuje zejména tématům: dimenze datové kvality, příčiny vzniku nekvality dat, dopady nekvalitních dat na podnik, Data Governance. Druhá, praktická část, se zabývá naplněním zmíněného hlavního cíle práce. V této části je představena samotná firma, vymezeny její požadavky na datovou kvalitu z hlediska byznysu, představeny procesy spojených se vstupem dat do firemního informačního systému, identifikovány zdroje vzniku chyb v dat. Dále je analyzován dataset firmy za použití techniky data profiling v nástroji Power BI Desktop k nalezení chyb (duplicity, překlepy atd.). Následně je dataset očištěn za použití stejného nástroje. Na závěr jsou představena doporučení k řízení datové kvality.
Keywords: Datová kvalita; Data Governance; Čištění dat; Data profiling
Thesis title: Managment of data quality and solving data quality problems
Author: Vu, Duc Long
Thesis type: Bachelor thesis
Supervisor: Fortinová, Jana
Opponents: Vančo, Pavel
Thesis language: Česky
Abstract:
This bachelor thesis deals with the topic of data quality and its management. The main goal of this work is to improve the quality of data in a small company. The whole bachelor thesis is divided into two parts. The first half focuses on summarizing theoretical knowledge in the areas of data quality and data management. The theoretical part deals mainly with the following topics: dimensions of data quality, causes of data poor quality, impacts of poor quality data on the company, Data Governance. The second, practical part, deals with the fulfillment of the main goal of the bachelor thesis. In this part, the company is introduced, requirements for data quality from the point of view of business are defined, the processes connected with the entry date into the corporate information system are introduced, the sources of data errors are identified. Furthermore, the company's data set is analysed using the data profiling technique in the Power BI Desktop to identify errors (duplications, typos, etc.). Subsequently, the data set is cleaned up using the same tool. Finally, recommendations for data quality management are presented.
Keywords: Data quality; Data Governance; Data profiling; Data cleaning

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 14. 10. 2020
Date of submission: 7. 5. 2021
Date of defense: 15. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/74712/podrobnosti

Files for download

    Last update: