Managment of data quality and solving data quality problems
Thesis title: | Řízení a řešení problémů kvality dat |
---|---|
Author: | Vu, Duc Long |
Thesis type: | Bakalářská práce |
Supervisor: | Fortinová, Jana |
Opponents: | Vančo, Pavel |
Thesis language: | Česky |
Abstract: | Tato bakalářská práce se zabývá tématem datové kvality a jejího řízení. Hlavním cílem práce je zlepšit kvalitu dat v malé firmě. Celá práce je rozdělena na dvě části. První polovina se zaměřuje na shrnutí teoretických poznatků v oblastí datové kvality a Data Governance. Teoretická část se věnuje zejména tématům: dimenze datové kvality, příčiny vzniku nekvality dat, dopady nekvalitních dat na podnik, Data Governance. Druhá, praktická část, se zabývá naplněním zmíněného hlavního cíle práce. V této části je představena samotná firma, vymezeny její požadavky na datovou kvalitu z hlediska byznysu, představeny procesy spojených se vstupem dat do firemního informačního systému, identifikovány zdroje vzniku chyb v dat. Dále je analyzován dataset firmy za použití techniky data profiling v nástroji Power BI Desktop k nalezení chyb (duplicity, překlepy atd.). Následně je dataset očištěn za použití stejného nástroje. Na závěr jsou představena doporučení k řízení datové kvality. |
Keywords: | Datová kvalita; Data Governance; Čištění dat; Data profiling |
Thesis title: | Managment of data quality and solving data quality problems |
---|---|
Author: | Vu, Duc Long |
Thesis type: | Bachelor thesis |
Supervisor: | Fortinová, Jana |
Opponents: | Vančo, Pavel |
Thesis language: | Česky |
Abstract: | This bachelor thesis deals with the topic of data quality and its management. The main goal of this work is to improve the quality of data in a small company. The whole bachelor thesis is divided into two parts. The first half focuses on summarizing theoretical knowledge in the areas of data quality and data management. The theoretical part deals mainly with the following topics: dimensions of data quality, causes of data poor quality, impacts of poor quality data on the company, Data Governance. The second, practical part, deals with the fulfillment of the main goal of the bachelor thesis. In this part, the company is introduced, requirements for data quality from the point of view of business are defined, the processes connected with the entry date into the corporate information system are introduced, the sources of data errors are identified. Furthermore, the company's data set is analysed using the data profiling technique in the Power BI Desktop to identify errors (duplications, typos, etc.). Subsequently, the data set is cleaned up using the same tool. Finally, recommendations for data quality management are presented. |
Keywords: | Data quality; Data Governance; Data profiling; Data cleaning |
Information about study
Study programme: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 14. 10. 2020 |
---|---|
Date of submission: | 7. 5. 2021 |
Date of defense: | 15. 6. 2021 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/74712/podrobnosti |