Ensuring Data Quality in SAP Data Services

Thesis title: Zajištění datové kvality v prostředí SAP Data Services
Author: Píchová, Michaela
Thesis type: Diplomová práce
Supervisor: Chlapek, Dušan
Opponents: Pour, Jan
Thesis language: Česky
Abstract:
Diplomová práce se zabývá tématem zajištění datové kvality v nástroji SAP Data Services. Cílem práce je popis datové kvality, dimenzí datové kvality, popis využití SAP Data Services pro řešení datové kvality ve vybraných dimenzích datové kvality a ověření navržených způsobů řešení datové kvality v SAP Data Services v praktické implementaci na případové studii. Literární rešerše zahrnuje druhy dat, životní cyklus dat, ETL proces, datový sklad, datovou kvalitu a dimenze datové kvality. Dále se práce soustředí na dostupné softwarové nástroje pro zajištění datové kvality s důrazem na nástroj SAP Data Services. Praktická část práce vybírá sedm dimenzí datové kvality. Navrhuje způsoby zajištění datové kvality ve vybraných dimenzích datové kvality pomocí nástroje SAP Data Services včetně jejich měření. Některé z navržených způsobů jsou následně ověřeny na případové studii pro společnost E.ON. V případové studii jsou implementovány kontroly datové kvality ve vybraných dimenzích datové kvality v nástroji SAP Data Services. Kontroly datové kvality jsou pomocí nástroje SAP Data Services implementovány jako relační tabulka v datovém skladu. Následně je relační tabulka z datového skladu vizualizována pro monitoring a rychlou reakci a opravu chyb. Práce přináší hodnotné poznatky pro organizace zabývající se datovou kvalitou a poskytuje praktický návod pro zlepšení datové kvality s využitím nástroje SAP Data Services.
Keywords: ETL; SAP Data Services; Business Intelligence; dimenze datové kvality; datová kvalita
Thesis title: Ensuring Data Quality in SAP Data Services
Author: Píchová, Michaela
Thesis type: Diploma thesis
Supervisor: Chlapek, Dušan
Opponents: Pour, Jan
Thesis language: Česky
Abstract:
The thesis addresses the topic of ensuring data quality using the SAP Data Services tool. The aim of the thesis is to describe data quality and its dimensions, the use of SAP Data Services for data quality management and verify the proposed methods in practical application. The literature review covers types of data, their lifecycle, ETL processes, data warehousing, data quality, and data quality dimensions. Furthermore, the thesis focuses on available software for ensuring data quality, with an emphasis on SAP Data Services. The practical part of the thesis selects seven dimensions of data quality and describes the methods of measuring and ensuring data quality within these chosen dimensions using the SAP Data Services tool. Some of the proposed methods are then verified through a case study for the company E.ON, where data quality controls are implemented in SAP Data Services. These controls log errors into a table in the data warehouse. The table is subsequently visualized for monitoring and quick response to error correction. The thesis provides valuable insights for organizations dealing with data quality and offers a practical guide for improving data quality using SAP Data Services.
Keywords: ETL; SAP Data Services; Business Intelligence; Data Quality; Data Quality Dimensions

Information about study

Study programme: Informační systémy a technologie/Business Intelligence
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 13. 3. 2024
Date of submission: 29. 11. 2024
Date of defense: 23. 1. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/88027/podrobnosti

Files for download

    Last update: