Automatizace developmentu DWH

Název práce: Automatizace developmentu DWH
Autor(ka) práce: Smetana, Marek
Typ práce: Bakalářská práce
Vedoucí práce: Karkošková, Soňa
Oponenti práce: Maryška, Miloš
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se věnuje automatizaci developmentu DWH. Hlavním cílem práce je implementace řešení pro automatizaci developmentu DWH. Práce je rozdělena do dvou hlavních částí: teoretického úvodu a praktické aplikace. V teoretické části je poskytnut podrobný přehled základních pojmu a současné literatury týkající se automatizace v DWH. Definovány jsou klíčové technologie a metodiky, včetně vysvětlení principů ETL (Extract, Transform, Load) a ELT (Extract, Load, Transform), které jsou základem pro práci s daty v datových skladech. Praktická část se zaměřuje na návrh a implementaci řešení pro zefektivnění vývoje datového skladu. Popsány jsou dva přístupy: použití pgSQL jako tradiční technologie developmentu DWH a dbt pro pokročilé automatizační funkce. Obě metody jsou následně porovnány z hlediska efektivity, rychlosti a snížení možnosti chyb v procesu developmentu. Výsledkem práce je poskytnutí jasného srovnání přínosů při využití nástroje dbt pro automatizaci datového skladu, a to na základě srovnání s tradičním přístupem vývoje. Celkově tato práce přináší ucelený pohled na automatizaci vývoje DWH s využitím nejnovějších technologií.
Klíčová slova: automatizace; datový sklad; dbt; PostgreSQL
Název práce: Automation of DWH development
Autor(ka) práce: Smetana, Marek
Typ práce: Bachelor thesis
Vedoucí práce: Karkošková, Soňa
Oponenti práce: Maryška, Miloš
Jazyk práce: Česky
Abstrakt:
This bachelor's thesis focuses on the automation of DWH development. The main objective of the thesis is to implement a solution for automating DWH development. The thesis is divided into two main parts: a theoretical introduction and practical application. In the theoretical part, a detailed overview of basic concepts and current literature related to DWH automation is provided. Key technologies and methodologies are defined, including an explanation of the principles of ETL (Extract, Transform, Load) and ELT (Extract, Load, Transform), which are fundamental for working with data in data warehouses. The practical part focuses on the design and implementation of solutions to enhance the efficiency of data warehouse development. Two approaches are described: the use of pgSQL as a traditional DWH development technology and dbt for advanced automation functions. Both methods are then compared in terms of efficiency, speed, and reduction of potential errors in the development process. The outcome of the thesis provides a clear comparison of the benefits of using the dbt tool for data warehouse automation, based on a comparison with the traditional development approach. Overall, this work presents a comprehensive view of DWH development automation using the latest technologies.
Klíčová slova: automation; data warehouse; PostgreSQL; dbt

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 2. 8. 2023
Datum podání práce: 6. 5. 2024
Datum obhajoby: 19. 6. 2024
Identifikátor v systému InSIS: https://insis.vse.cz/zp/85119/podrobnosti

Soubory ke stažení

    Poslední aktualizace: