Data quality in DWH
Thesis title: | Datová kvalita v rámci DWH |
---|---|
Author: | Kukla, David |
Thesis type: | Bakalářská práce |
Supervisor: | Karkošková, Soňa |
Opponents: | Palovská, Helena |
Thesis language: | Česky |
Abstract: | Tato bakalářská práce řeší problém snížené datové kvality v rámci datového skladu na praktickém příkladu pojišťovny. Toto téma jsem zvolil z důvodu, že je velice aktuální. S nekvalitními daty se setkávám denně v zaměstnání. Rád bych představil jednoduché řešení pro malé podniky, které nemají prostředky na DQ programy. Pro vyřešení toho problému jsou stanoveny tři dílčí cíle. Prvním cílem je popis struktury datového skladu, který nám pomůže pochopit zasazení datového skladu do BI řešení. Druhým cílem je definice a řízení datové kvality, toto nám pomůže pro vyhodnocení aktuálního stavu a pochopení základních metrik a metodik. Posledním cílem je samotný návrh a implementace řešení reálného problému. Práce se dělí na teoretickou a praktickou část. První a druhý cíl spadají do teoretické části, třetí cíl je část praktická.V praktické části byl proveden data profiling, který pomohl pro pochopení problému a slabých míst stávajícího řešení. Následně byl vytvořen návrh a implementace řešení. Na základě testů provedených před ostrým nasazením, bylo posouzeno za vhodné. Po nasazení bylo provedeno dotazníkové šetření s odběratelem a ten byl nadmíru spokojen. Výsledkem je funkční univerzální řešení, spokojený odběratel a plno ušetřeného času. Řešení je dostupné v příloze BP na CD. |
Keywords: | datový sklad; business intelligence; čištění dat; datová kvalita |
Thesis title: | Data quality in DWH |
---|---|
Author: | Kukla, David |
Thesis type: | Bachelor thesis |
Supervisor: | Karkošková, Soňa |
Opponents: | Palovská, Helena |
Thesis language: | Česky |
Abstract: | This bachelor thesis solves the problem of reduced data quality within the data warehouse on the practical example of the insurance company. I chose this topic because it is very actual and important. I encounter problems with poor data quality every day in work. I would like to introduce a simple solution for small businesses that do not have resources for data quality program. Three sub-goals are set to solve this problem. The first goal is to describe the structure of data warehouse, which will help us to understand position of data warehouse in business intelligence solution. The second goal is a definition of data quality and its managing, this will help us to evaluate the current condition and understand the basic metrics and methodologies. The last goal is to design and implement a solution to a real problem. The thesis is divided into theoretical and practical part. The first and second goal belong into the theoretical part. The third goal belongs in practical part.Data profiling was performed in the practical part, which helped to understand the problem and weaknesses of the existing solution. Subsequently, the design and implementation of the solution was created. Based on the tests performed before the live deployment, the solution was considered appropriate. After deployment, a questionnaire survey was carried out with the customer and he was very satisfied. The result is a functional universal solution, a satisfied customer and a lot of time saved. The solution is available in attachment of thesis on the CD. |
Keywords: | data cleansing; business intelligence; data quality; data warehouse |
Information about study
Study programme: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 8. 1. 2019 |
---|---|
Date of submission: | 5. 5. 2019 |
Date of defense: | 17. 6. 2019 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/68751/podrobnosti |