Design and solution of data quality within an ETL process

Thesis title: Návrh a řešení kvality dat v rámci ETL procesu
Author: Prošek, Martin
Thesis type: Bakalářská práce
Supervisor: Chlapek, Dušan
Opponents: Pour, Jan
Thesis language: Česky
Abstract:
Tato bakalářská práce se zabývá problematikou datové kvality v rámci ETL (Extract, Transform, Load) procesu v prostředí konkrétní pojišťovny. Cílem práce je identifikovat dimenze datové kvality na základě odborné literatury, analyzovat jejich řešení v procesu synchronizace centrální databáze uživatelů (CUD) a navrhnout a implementovat konkrétní opatření pro jejich zajištění. První část práce poskytuje přehled o datové kvalitě, jejích dimenzích a řízení v kontextu ETL procesů. V druhé části je popsána analýza aktuálního stavu pomocí dotazníkového šetření a rozhovorů se zaměstnanci, na jejímž základě jsou navržena a implementována dvě řešení zajištění kvality dat v procesu. Výsledkem implementace navržených opatření je automatické monitorování kvality dat ve vybraném systému a podnět k jejímu zlepšení.
Keywords: pojišťovna; centrální databáze uživatelů; validace; datová kvalita; ETL procesy; zajištění
Thesis title: Design and solution of data quality within an ETL process
Author: Prošek, Martin
Thesis type: Bachelor thesis
Supervisor: Chlapek, Dušan
Opponents: Pour, Jan
Thesis language: Česky
Abstract:
This bachelor’s thesis addresses the issue of data quality within the ETL (Extract, Transform, Load) process in the environment of a specific insurance company. The aim of the thesis is to identify data quality dimensions based on academic literature, analyse how they are addressed in the synchronization process of the central user database (CUD), and propose and implement specific measures to ensure them. The first part of the thesis provides an overview of data quality, its dimensions, and management within the context of ETL processes. The second part describes an analysis of the current state through a questionnaire survey and interviews with employees, on the basis of which solutions for ensuring data quality in the process are proposed and implemented. The result of implementing the proposed solutions is the automatic monitoring of data quality in the selected system and initiative for its improvement.
Keywords: data quality; assurance; validation; insurance company; central user database; ETL processes

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 13. 6. 2024
Date of submission: 9. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: