Řízení a řešení problémů kvality dat
Název práce: | Řízení a řešení problémů kvality dat |
---|---|
Autor(ka) práce: | Vu, Duc Long |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Fortinová, Jana |
Oponenti práce: | Vančo, Pavel |
Jazyk práce: | Česky |
Abstrakt: | Tato bakalářská práce se zabývá tématem datové kvality a jejího řízení. Hlavním cílem práce je zlepšit kvalitu dat v malé firmě. Celá práce je rozdělena na dvě části. První polovina se zaměřuje na shrnutí teoretických poznatků v oblastí datové kvality a Data Governance. Teoretická část se věnuje zejména tématům: dimenze datové kvality, příčiny vzniku nekvality dat, dopady nekvalitních dat na podnik, Data Governance. Druhá, praktická část, se zabývá naplněním zmíněného hlavního cíle práce. V této části je představena samotná firma, vymezeny její požadavky na datovou kvalitu z hlediska byznysu, představeny procesy spojených se vstupem dat do firemního informačního systému, identifikovány zdroje vzniku chyb v dat. Dále je analyzován dataset firmy za použití techniky data profiling v nástroji Power BI Desktop k nalezení chyb (duplicity, překlepy atd.). Následně je dataset očištěn za použití stejného nástroje. Na závěr jsou představena doporučení k řízení datové kvality. |
Klíčová slova: | Datová kvalita; Data Governance; Čištění dat; Data profiling |
Název práce: | Managment of data quality and solving data quality problems |
---|---|
Autor(ka) práce: | Vu, Duc Long |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Fortinová, Jana |
Oponenti práce: | Vančo, Pavel |
Jazyk práce: | Česky |
Abstrakt: | This bachelor thesis deals with the topic of data quality and its management. The main goal of this work is to improve the quality of data in a small company. The whole bachelor thesis is divided into two parts. The first half focuses on summarizing theoretical knowledge in the areas of data quality and data management. The theoretical part deals mainly with the following topics: dimensions of data quality, causes of data poor quality, impacts of poor quality data on the company, Data Governance. The second, practical part, deals with the fulfillment of the main goal of the bachelor thesis. In this part, the company is introduced, requirements for data quality from the point of view of business are defined, the processes connected with the entry date into the corporate information system are introduced, the sources of data errors are identified. Furthermore, the company's data set is analysed using the data profiling technique in the Power BI Desktop to identify errors (duplications, typos, etc.). Subsequently, the data set is cleaned up using the same tool. Finally, recommendations for data quality management are presented. |
Klíčová slova: | Data quality; Data Governance; Data profiling; Data cleaning |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 14. 10. 2020 |
---|---|
Datum podání práce: | 7. 5. 2021 |
Datum obhajoby: | 15. 6. 2021 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/74712/podrobnosti |