Implementation of data quality controls in data warehouse

Thesis title: Implementace kontrol kvality dat v datovém skladě
Author: Filina, Irina
Thesis type: Diplomová práce
Supervisor: Novotný, Ota
Opponents: Pour, Jan
Thesis language: Česky
Abstract:
Diplomová práce se věnuje problematice datové kvality v rámci BI řešení a implementaci její kontroly na vstupu do datového skladu. Teoretická část začíná uvedením čtenáře do oboru Business Intelligence, popisuje historii a základní pojmy, vysvětluje architekturu BI řešení a její základní prvky. Poté jsou popisovány typy dat v datovém skladě, jejich životní cyklus. Vyhrazená podkapitola je věnována metadatům, jejich účelu a způsobu jejich použití v datovém skladě. Další kapitoly teoretické části směřují k tematice kvality dat, definici daného pojmu a jeho dimenzí, příčinám vzniku nekvalitních dat a dopadům jejich vzniku, a to včetně finančních. V praktické části se diplomová práce zaměřuje na problémy kvality dat konkrétní finanční instituce a celkovou problematiku jejích řešení pomocí zavedení kontrol. Hlavními výstupy práce jsou především vytvoření, otestovaní a nasazení řešení pro rozbalení a kontrolu datových extraktů na vstupu do datového skladu finanční instituce a shrnutí závěrů analýz a výzkumů v provedených v rámci dané diplomové práce. Na závěr práce jsou popsány možnosti dalšího rozvoje daného projektu a stav plnění cílů definovaných na začátku.
Keywords: business intelligence; datová kvalita; datový sklad; metadata
Thesis title: Implementation of data quality controls in data warehouse
Author: Filina, Irina
Thesis type: Diploma thesis
Supervisor: Novotný, Ota
Opponents: Pour, Jan
Thesis language: Česky
Abstract:
The diploma thesis is devoted to data quality problems in Business Intelligence (BI) solutions and related data quality controls implementation on data input level of the data warehouse (DWH). The theoretical part brings at the beginning an introduction into BI field, history and basic concepts description, explanation of BI solution architecture and its main parts. Then main types of data in DWH and data lifecycle are described. The next separated part is dedicated to metadata and its purpose and usage in DWH. Next chapters of theoretical part are oriented to the of data quality topic, definition of given concept and its dimensions, reasons of poor data appearing and related impacts, including financial ones. In the practical part, diploma thesis focuses on the data quality problems in a frame of a specific financial institution and on solution of these problems by checks implementation. Main outputs of this thesis are primarily creation, testing and deployment of the solution for processing and checking of data extracts on the input level of the DWH and conclusion of analysis and researches made in this diploma thesis. In the final chapter of the thesis possibilities of given project further development are proposed and the originally defined objectives achievement is described.
Keywords: business intelligence; data quality; data warehouse; metadata

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 19. 4. 2016
Date of submission: 7. 12. 2018
Date of defense: 24. 1. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/57390/podrobnosti

Files for download

    Last update: