Data quality in the business information database environment

Thesis title: Datová kvalita v prostředí databáze hospodářských informací
Author: Cabalka, Martin
Thesis type: Diplomová práce
Supervisor: Chlapek, Dušan
Opponents: Kučera, Jan
Thesis language: Česky
Abstract:
Diplomová práce se zabývá výběrem vhodných dimenzí datové kvality pro zvolenou databázi hospodářských informací, následným návrhem a implementací metrik pro jejich vyhodnocování. Cílem práce je definice pojmu datová kvalita v kontextu databáze hospodářských informací a možnosti jejího měření. Na základě dimenzí vhodných ke sledování je sestaven seznam metrik. Tyto metriky jsou následně implementovány v dotazovacím jazyce SQL, případně procedurální nástavbě Transact SQL. Metriky jsou rovněž otestovány nad reálnými daty a výsledky komentovány. Hlavní přínos této práce je komplexní zpracování tématu datové kvality od teoretického popisu jednotlivých činností, až po konkrétní implementace jednotlivých metrik. Zároveň práce nabízí několik teoretických i praktických směrů, kterými lze dané téma rozvíjet.
Keywords: Databáze; metriky datové kvality; dimenze datové kvality; datová kvalita
Thesis title: Data quality in the business information database environment
Author: Cabalka, Martin
Thesis type: Diploma thesis
Supervisor: Chlapek, Dušan
Opponents: Kučera, Jan
Thesis language: Česky
Abstract:
This master thesis is concerned with the choice of suitable data quality dimensions for a particular database of economy information and proposes and implements metrics for its assessment. The aim of this paper is to define the term data quality in the context of economy information database and possible ways to measure it. Based on dimensions suitable to observe, a list of metrics was created and subsequently implemented in SQL query language, alternatively in a procedural extension Transact SQL. These metrics were also tested with the use of real data and the results were provided with a commentary. The main asset of this work is its complex processing of the data quality topic, from theoretical term definition to particular implementation of individual metrics. Finally, this study offers a variety of both theoretical and practical directions fort this issue to be further researched.
Keywords: Database; data quality metrics; data quality dimensions; data quality

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 8. 10. 2015
Date of submission: 1. 12. 2016
Date of defense: 27. 1. 2017
Identifier in the InSIS system: https://insis.vse.cz/zp/54614/podrobnosti

Files for download

    Last update: