Automation of DWH development

Thesis title: Automatizace developmentu DWH
Author: Smetana, Marek
Thesis type: Bakalářská práce
Supervisor: Karkošková, Soňa
Opponents: Maryška, Miloš
Thesis language: Česky
Abstract:
Tato bakalářská práce se věnuje automatizaci developmentu DWH. Hlavním cílem práce je implementace řešení pro automatizaci developmentu DWH. Práce je rozdělena do dvou hlavních částí: teoretického úvodu a praktické aplikace. V teoretické části je poskytnut podrobný přehled základních pojmu a současné literatury týkající se automatizace v DWH. Definovány jsou klíčové technologie a metodiky, včetně vysvětlení principů ETL (Extract, Transform, Load) a ELT (Extract, Load, Transform), které jsou základem pro práci s daty v datových skladech. Praktická část se zaměřuje na návrh a implementaci řešení pro zefektivnění vývoje datového skladu. Popsány jsou dva přístupy: použití pgSQL jako tradiční technologie developmentu DWH a dbt pro pokročilé automatizační funkce. Obě metody jsou následně porovnány z hlediska efektivity, rychlosti a snížení možnosti chyb v procesu developmentu. Výsledkem práce je poskytnutí jasného srovnání přínosů při využití nástroje dbt pro automatizaci datového skladu, a to na základě srovnání s tradičním přístupem vývoje. Celkově tato práce přináší ucelený pohled na automatizaci vývoje DWH s využitím nejnovějších technologií.
Keywords: automatizace; datový sklad; dbt; PostgreSQL
Thesis title: Automation of DWH development
Author: Smetana, Marek
Thesis type: Bachelor thesis
Supervisor: Karkošková, Soňa
Opponents: Maryška, Miloš
Thesis language: Česky
Abstract:
This bachelor's thesis focuses on the automation of DWH development. The main objective of the thesis is to implement a solution for automating DWH development. The thesis is divided into two main parts: a theoretical introduction and practical application. In the theoretical part, a detailed overview of basic concepts and current literature related to DWH automation is provided. Key technologies and methodologies are defined, including an explanation of the principles of ETL (Extract, Transform, Load) and ELT (Extract, Load, Transform), which are fundamental for working with data in data warehouses. The practical part focuses on the design and implementation of solutions to enhance the efficiency of data warehouse development. Two approaches are described: the use of pgSQL as a traditional DWH development technology and dbt for advanced automation functions. Both methods are then compared in terms of efficiency, speed, and reduction of potential errors in the development process. The outcome of the thesis provides a clear comparison of the benefits of using the dbt tool for data warehouse automation, based on a comparison with the traditional development approach. Overall, this work presents a comprehensive view of DWH development automation using the latest technologies.
Keywords: automation; data warehouse; PostgreSQL; dbt

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 2. 8. 2023
Date of submission: 6. 5. 2024
Date of defense: 19. 6. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/85119/podrobnosti

Files for download

    Last update: