Creation of tool for improvement of data warehouse development

Thesis title: Vytvoření nástroje pro zefektivnění vývoje datového skladu
Author: Rákos, Jan
Thesis type: Diplomová práce
Supervisor: Palovská, Helena
Opponents: Kučera, Jan
Thesis language: Česky
Abstract:
Tato diplomová práce je zaměřena na zefektivnění vývoje konkrétního datového skladu.V rámci jedné z ETL transformací se do tohoto datového skladu načítají všechny zdrojovésystémy najednou. Neexistence možnosti transformaci rozdělit způsobuje v případě, kdy bystačilo testovat jen transformace určitých zdrojových systémů, zbytečné prodlevytestovacích nápočtů a zbytečné zatížení testovacího prostředí. Cílem této práce je navrhnouta implementovat řešení tohoto problému.K řešení problému je přistupováno podle metodiky Design Science Research, kteránapomáhá k vytváření úspěšných artefaktů v oblasti informačních technologií. Navrženýmřešením je vytvoření nástroje, který umožní rozdělení problémové ETL transformace aumožní provedení testovacích nápočtů jen pro potřebné zdrojové systémy. Nástroj jeimplementován pomocí jazyka PowerShell.Ověření, že nástroj slouží k navrhovaným účelům a řeší zmíněný problém, je provedenopomocí experimentu, v jehož rámci jsou porovnávány oddělené nápočty provedenés použitím nově vytvořeného nástroje a úplný nápočet provedený stávajícím způsobem. Nazákladě vyhodnocení experimentu je zjištěno, že použití nástroje vede k zefektivněnítestovacích nápočtů.
Keywords: Design Science Research; datový sklad; ETL; PowerShell; vývoj softwaru
Thesis title: Creation of tool for improvement of data warehouse development
Author: Rákos, Jan
Thesis type: Diploma thesis
Supervisor: Palovská, Helena
Opponents: Kučera, Jan
Thesis language: Česky
Abstract:
This thesis is focused on improvement of development of specific data warehouse. Withinone of the ETL transformations, all source systems are loaded into this data warehouse atonce. The absence of the ability to divide the transformation causes unnecessary delays intest calculations and unnecessary load on the test environment. The goal of this thesis is todesign and implement a solution to this problem.The problem is solved according to the Design Science Research methodology, which helpsto create successful information technology artifacts. The proposed solution is to create a tool that will enable the separation of ETL transformation and allow execution of testingcalculations only for the necessary source systems. The tool is implemented usingPowerShell.Verifying that the tool is used for the proposed purposes and solves the problem is donethrough an experiment. Experiment compares the current complete calculation withseparate calculations which are made using the newly created tool. Based on the evaluationof the experiment, it is found that the using of the tool leads to more efficient executing oftesting calculations.
Keywords: software development; Design Science Research; ETL; data warehouse; PowerShell

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 10. 12. 2018
Date of submission: 29. 4. 2019
Date of defense: 28. 5. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/68016/podrobnosti

Files for download

    Last update: