Řízení a řešení problémů kvality dat

Název práce: Řízení a řešení problémů kvality dat
Autor(ka) práce: Vu, Duc Long
Typ práce: Bakalářská práce
Vedoucí práce: Fortinová, Jana
Oponenti práce: Vančo, Pavel
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zabývá tématem datové kvality a jejího řízení. Hlavním cílem práce je zlepšit kvalitu dat v malé firmě. Celá práce je rozdělena na dvě části. První polovina se zaměřuje na shrnutí teoretických poznatků v oblastí datové kvality a Data Governance. Teoretická část se věnuje zejména tématům: dimenze datové kvality, příčiny vzniku nekvality dat, dopady nekvalitních dat na podnik, Data Governance. Druhá, praktická část, se zabývá naplněním zmíněného hlavního cíle práce. V této části je představena samotná firma, vymezeny její požadavky na datovou kvalitu z hlediska byznysu, představeny procesy spojených se vstupem dat do firemního informačního systému, identifikovány zdroje vzniku chyb v dat. Dále je analyzován dataset firmy za použití techniky data profiling v nástroji Power BI Desktop k nalezení chyb (duplicity, překlepy atd.). Následně je dataset očištěn za použití stejného nástroje. Na závěr jsou představena doporučení k řízení datové kvality.
Klíčová slova: Datová kvalita; Data Governance; Čištění dat; Data profiling
Název práce: Managment of data quality and solving data quality problems
Autor(ka) práce: Vu, Duc Long
Typ práce: Bachelor thesis
Vedoucí práce: Fortinová, Jana
Oponenti práce: Vančo, Pavel
Jazyk práce: Česky
Abstrakt:
This bachelor thesis deals with the topic of data quality and its management. The main goal of this work is to improve the quality of data in a small company. The whole bachelor thesis is divided into two parts. The first half focuses on summarizing theoretical knowledge in the areas of data quality and data management. The theoretical part deals mainly with the following topics: dimensions of data quality, causes of data poor quality, impacts of poor quality data on the company, Data Governance. The second, practical part, deals with the fulfillment of the main goal of the bachelor thesis. In this part, the company is introduced, requirements for data quality from the point of view of business are defined, the processes connected with the entry date into the corporate information system are introduced, the sources of data errors are identified. Furthermore, the company's data set is analysed using the data profiling technique in the Power BI Desktop to identify errors (duplications, typos, etc.). Subsequently, the data set is cleaned up using the same tool. Finally, recommendations for data quality management are presented.
Klíčová slova: Data quality; Data Governance; Data profiling; Data cleaning

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 14. 10. 2020
Datum podání práce: 7. 5. 2021
Datum obhajoby: 15. 6. 2021
Identifikátor v systému InSIS: https://insis.vse.cz/zp/74712/podrobnosti

Soubory ke stažení

    Poslední aktualizace: