Data quality in the business information database environment
Thesis title: | Datová kvalita v prostředí databáze hospodářských informací |
---|---|
Author: | Cabalka, Martin |
Thesis type: | Diplomová práce |
Supervisor: | Chlapek, Dušan |
Opponents: | Kučera, Jan |
Thesis language: | Česky |
Abstract: | Diplomová práce se zabývá výběrem vhodných dimenzí datové kvality pro zvolenou databázi hospodářských informací, následným návrhem a implementací metrik pro jejich vyhodnocování. Cílem práce je definice pojmu datová kvalita v kontextu databáze hospodářských informací a možnosti jejího měření. Na základě dimenzí vhodných ke sledování je sestaven seznam metrik. Tyto metriky jsou následně implementovány v dotazovacím jazyce SQL, případně procedurální nástavbě Transact SQL. Metriky jsou rovněž otestovány nad reálnými daty a výsledky komentovány. Hlavní přínos této práce je komplexní zpracování tématu datové kvality od teoretického popisu jednotlivých činností, až po konkrétní implementace jednotlivých metrik. Zároveň práce nabízí několik teoretických i praktických směrů, kterými lze dané téma rozvíjet. |
Keywords: | Databáze; metriky datové kvality; dimenze datové kvality; datová kvalita |
Thesis title: | Data quality in the business information database environment |
---|---|
Author: | Cabalka, Martin |
Thesis type: | Diploma thesis |
Supervisor: | Chlapek, Dušan |
Opponents: | Kučera, Jan |
Thesis language: | Česky |
Abstract: | This master thesis is concerned with the choice of suitable data quality dimensions for a particular database of economy information and proposes and implements metrics for its assessment. The aim of this paper is to define the term data quality in the context of economy information database and possible ways to measure it. Based on dimensions suitable to observe, a list of metrics was created and subsequently implemented in SQL query language, alternatively in a procedural extension Transact SQL. These metrics were also tested with the use of real data and the results were provided with a commentary. The main asset of this work is its complex processing of the data quality topic, from theoretical term definition to particular implementation of individual metrics. Finally, this study offers a variety of both theoretical and practical directions fort this issue to be further researched. |
Keywords: | Database; data quality metrics; data quality dimensions; data quality |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 8. 10. 2015 |
---|---|
Date of submission: | 1. 12. 2016 |
Date of defense: | 27. 1. 2017 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/54614/podrobnosti |