Datová archivace a historizace v rámci DWH
Název práce: | Datová archivace a historizace v rámci DWH |
---|---|
Autor(ka) práce: | Kukla, David |
Typ práce: | Diplomová práce |
Vedoucí práce: | Pour, Jan |
Oponenti práce: | Šedivá, Zuzana |
Jazyk práce: | Česky |
Abstrakt: | Tato diplomová práce se zabývá problematikou datové historizace a archivace v rámci datového skladu. Cílem diplomové práce je navrhnout archivační koncept dle zadání fiktivní firmy. V první části jsou představeny pojmy a čtenář uveden do problematiky. Autor předkládá znalosti z odborných publikací, které rozšiřuje o své praktické poznatky. Na základě těchto poznatků je provedena analýza a návrh archivačního konceptu. V druhé části autor předkládá svůj koncept, který implementuje dle vlastního návrhu. Součástí konceptu je stanovení archivační metodiky a výroba a implementace datového archivu společně s archivačním nástrojem. Archiv je vytvořen na technologii Hadoop a připojen k produkčnímu datovému skladu pomocí Polybase. Výsledkem konceptu je optimalizace datového skladu za pomocí přesunu části již nepotřebných dat do archivu. BI řešení je rozšířeno o nezávislý, škálovatelný a plně dostupný archiv, který se v budoucnu nemusí obávat výzev jako je například Big Data. |
Klíčová slova: | Datová historizace; Databázová archivace; Hadoop; SQL; datový sklad; Polaybase |
Název práce: | Data archivation and historization in DWH |
---|---|
Autor(ka) práce: | Kukla, David |
Typ práce: | Diploma thesis |
Vedoucí práce: | Pour, Jan |
Oponenti práce: | Šedivá, Zuzana |
Jazyk práce: | Česky |
Abstrakt: | This diploma thesis deals with issue of data historization and archiving within data warehouse. The aim of the diploma thesis is to design an archiving concept according to assignment of a fictious company. In the first part of diploma thesis, the concepts are introduced to the reader. The author present knowledge from professional publications, which is expanded by author´s practical knowledge. An analysis and design of the archiving concept is based on these findings. In the second part of diploma thesis, author present his concept, which is implemented according to his own design. Part of the concept is the determination of archiving methodology and the creation of data archive together with an archiving tool. The archive is created on Hadoop technology and connected to the production data warehouse by Polybase technology. The result of the concept is the optimalization the data warehouse by moving some of the unactual data to the archive. The BI solution is extended by an independent, scalable and fully accessible archive, which does not have to worry about future challenges such as Big Data. |
Klíčová slova: | Hadoop; SQL; data warehouse; Polybase; database archiving; data historization |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 7. 11. 2020 |
---|---|
Datum podání práce: | 29. 4. 2022 |
Datum obhajoby: | 9. 6. 2022 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/75038/podrobnosti |