Data quality in DWH

Thesis title: Datová kvalita v rámci DWH
Author: Kukla, David
Thesis type: Bakalářská práce
Supervisor: Karkošková, Soňa
Opponents: Palovská, Helena
Thesis language: Česky
Abstract:
Tato bakalářská práce řeší problém snížené datové kvality v rámci datového skladu na praktickém příkladu pojišťovny. Toto téma jsem zvolil z důvodu, že je velice aktuální. S nekvalitními daty se setkávám denně v zaměstnání. Rád bych představil jednoduché řešení pro malé podniky, které nemají prostředky na DQ programy. Pro vyřešení toho problému jsou stanoveny tři dílčí cíle. Prvním cílem je popis struktury datového skladu, který nám pomůže pochopit zasazení datového skladu do BI řešení. Druhým cílem je definice a řízení datové kvality, toto nám pomůže pro vyhodnocení aktuálního stavu a pochopení základních metrik a metodik. Posledním cílem je samotný návrh a implementace řešení reálného problému. Práce se dělí na teoretickou a praktickou část. První a druhý cíl spadají do teoretické části, třetí cíl je část praktická.V praktické části byl proveden data profiling, který pomohl pro pochopení problému a slabých míst stávajícího řešení. Následně byl vytvořen návrh a implementace řešení. Na základě testů provedených před ostrým nasazením, bylo posouzeno za vhodné. Po nasazení bylo provedeno dotazníkové šetření s odběratelem a ten byl nadmíru spokojen. Výsledkem je funkční univerzální řešení, spokojený odběratel a plno ušetřeného času. Řešení je dostupné v příloze BP na CD.
Keywords: datový sklad; business intelligence; čištění dat; datová kvalita
Thesis title: Data quality in DWH
Author: Kukla, David
Thesis type: Bachelor thesis
Supervisor: Karkošková, Soňa
Opponents: Palovská, Helena
Thesis language: Česky
Abstract:
This bachelor thesis solves the problem of reduced data quality within the data warehouse on the practical example of the insurance company. I chose this topic because it is very actual and important. I encounter problems with poor data quality every day in work. I would like to introduce a simple solution for small businesses that do not have resources for data quality program. Three sub-goals are set to solve this problem. The first goal is to describe the structure of data warehouse, which will help us to understand position of data warehouse in business intelligence solution. The second goal is a definition of data quality and its managing, this will help us to evaluate the current condition and understand the basic metrics and methodologies. The last goal is to design and implement a solution to a real problem. The thesis is divided into theoretical and practical part. The first and second goal belong into the theoretical part. The third goal belongs in practical part.Data profiling was performed in the practical part, which helped to understand the problem and weaknesses of the existing solution. Subsequently, the design and implementation of the solution was created. Based on the tests performed before the live deployment, the solution was considered appropriate. After deployment, a questionnaire survey was carried out with the customer and he was very satisfied. The result is a functional universal solution, a satisfied customer and a lot of time saved. The solution is available in attachment of thesis on the CD.
Keywords: data cleansing; business intelligence; data quality; data warehouse

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 8. 1. 2019
Date of submission: 5. 5. 2019
Date of defense: 17. 6. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/68751/podrobnosti

Files for download

    Last update: