Thesis title: |
Návrh a řešení kvality dat v rámci ETL procesu |
Author: |
Prošek, Martin |
Thesis type: |
Bakalářská práce |
Supervisor: |
Chlapek, Dušan |
Opponents: |
Pour, Jan |
Thesis language: |
Česky |
Abstract: |
Tato bakalářská práce se zabývá problematikou datové kvality v rámci ETL (Extract, Transform, Load) procesu v prostředí konkrétní pojišťovny. Cílem práce je identifikovat dimenze datové kvality na základě odborné literatury, analyzovat jejich řešení v procesu synchronizace centrální databáze uživatelů (CUD) a navrhnout a implementovat konkrétní opatření pro jejich zajištění. První část práce poskytuje přehled o datové kvalitě, jejích dimenzích a řízení v kontextu ETL procesů. V druhé části je popsána analýza aktuálního stavu pomocí dotazníkového šetření a rozhovorů se zaměstnanci, na jejímž základě jsou navržena a implementována dvě řešení zajištění kvality dat v procesu. Výsledkem implementace navržených opatření je automatické monitorování kvality dat ve vybraném systému a podnět k jejímu zlepšení. |
Keywords: |
pojišťovna; centrální databáze uživatelů; validace; datová kvalita; ETL procesy; zajištění |
Thesis title: |
Design and solution of data quality within an ETL process |
Author: |
Prošek, Martin |
Thesis type: |
Bachelor thesis |
Supervisor: |
Chlapek, Dušan |
Opponents: |
Pour, Jan |
Thesis language: |
Česky |
Abstract: |
This bachelor’s thesis addresses the issue of data quality within the ETL (Extract, Transform, Load) process in the environment of a specific insurance company. The aim of the thesis is to identify data quality dimensions based on academic literature, analyse how they are addressed in the synchronization process of the central user database (CUD), and propose and implement specific measures to ensure them. The first part of the thesis provides an overview of data quality, its dimensions, and management within the context of ETL processes. The second part describes an analysis of the current state through a questionnaire survey and interviews with employees, on the basis of which solutions for ensuring data quality in the process are proposed and implemented. The result of implementing the proposed solutions is the automatic monitoring of data quality in the selected system and initiative for its improvement. |
Keywords: |
data quality; assurance; validation; insurance company; central user database; ETL processes |
Information about study
Study programme: |
Aplikovaná informatika |
Type of study programme: |
Bakalářský studijní program |
Assigned degree: |
Bc. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Information Technologies |
Information on submission and defense
Date of assignment: |
13. 6. 2024 |
Date of submission: |
9. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.