Data archivation and historization in DWH

Thesis title: Datová archivace a historizace v rámci DWH
Author: Kukla, David
Thesis type: Diplomová práce
Supervisor: Pour, Jan
Opponents: Šedivá, Zuzana
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá problematikou datové historizace a archivace v rámci datového skladu. Cílem diplomové práce je navrhnout archivační koncept dle zadání fiktivní firmy. V první části jsou představeny pojmy a čtenář uveden do problematiky. Autor předkládá znalosti z odborných publikací, které rozšiřuje o své praktické poznatky. Na základě těchto poznatků je provedena analýza a návrh archivačního konceptu. V druhé části autor předkládá svůj koncept, který implementuje dle vlastního návrhu. Součástí konceptu je stanovení archivační metodiky a výroba a implementace datového archivu společně s archivačním nástrojem. Archiv je vytvořen na technologii Hadoop a připojen k produkčnímu datovému skladu pomocí Polybase. Výsledkem konceptu je optimalizace datového skladu za pomocí přesunu části již nepotřebných dat do archivu. BI řešení je rozšířeno o nezávislý, škálovatelný a plně dostupný archiv, který se v budoucnu nemusí obávat výzev jako je například Big Data.
Keywords: Datová historizace; Databázová archivace; Hadoop; SQL; datový sklad; Polaybase
Thesis title: Data archivation and historization in DWH
Author: Kukla, David
Thesis type: Diploma thesis
Supervisor: Pour, Jan
Opponents: Šedivá, Zuzana
Thesis language: Česky
Abstract:
This diploma thesis deals with issue of data historization and archiving within data warehouse. The aim of the diploma thesis is to design an archiving concept according to assignment of a fictious company. In the first part of diploma thesis, the concepts are introduced to the reader. The author present knowledge from professional publications, which is expanded by author´s practical knowledge. An analysis and design of the archiving concept is based on these findings. In the second part of diploma thesis, author present his concept, which is implemented according to his own design. Part of the concept is the determination of archiving methodology and the creation of data archive together with an archiving tool. The archive is created on Hadoop technology and connected to the production data warehouse by Polybase technology. The result of the concept is the optimalization the data warehouse by moving some of the unactual data to the archive. The BI solution is extended by an independent, scalable and fully accessible archive, which does not have to worry about future challenges such as Big Data.
Keywords: Hadoop; SQL; data warehouse; Polybase; database archiving; data historization

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 7. 11. 2020
Date of submission: 29. 4. 2022
Date of defense: 9. 6. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/75038/podrobnosti

Files for download

    Last update: