Design and implementation of a data warehouse solution for a web application project

Thesis title: Návrh a implementace datového skladu v cloudovém prostředí pro projekt webové aplikace vybrané společnosti
Author: Pěrůžek, Jan
Thesis type: Diplomová práce
Supervisor: Maryška, Miloš
Opponents: Sládek, Pavel
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá návrhem a implementací datového skladu pro projekt webové aplikace. Významným aspektem celého technického řešení je to, že je postavené na cloudových službách, a to sice od společnosti Google. Kromě datového skladu práce pojednává i o napojení dat do vizualizačního nástroje a vytvoření základního dashboardu. Práce je dohromady tvořena šesti kapitolami, přičemž první dvě tvoří teoretickou část této diplomové práce a zbylé čtyři praktickou. V teoretické části je čtenář nejprve seznámen se základními aspekty datové analytiky a Business Intelligence, následně jednotlivými komponentami, ze kterých se typicky skládají Business Intelligence řešení a možnými architekturami pro Business Intelligence. Teoretickou část uzavírá kapitola věnovaná nástrojům, které jsou použity pro realizaci praktického řešení v praktické části. Praktická část se věnuje vlastnímu návrhu řešení a jeho následné implementaci s využitím nástrojů, které jsou představeny v teoretické části. Mezi cíli této práce bylo shromáždit požadavky na výsledné řešení, navrhnout datový sklad v cloudovém prostředí služby Big Query do společnosti Google, následně tento návrh implementovat, a to včetně tvorby datových pump a celkově automatizace zpracování dat a v neposlední řadě vytvořené řešení napojit do vizualizačního nástroje Google Data Studio a vytvořit v něm základní dashboard.
Keywords: datový sklad; Data; datové tržiště; Business Intelligence; Big Query; Google Analytics; Data Studio; analytika; cloud
Thesis title: Design and implementation of a data warehouse solution for a web application project
Author: Pěrůžek, Jan
Thesis type: Diploma thesis
Supervisor: Maryška, Miloš
Opponents: Sládek, Pavel
Thesis language: Česky
Abstract:
This thesis focuses on the design and implementation of a data warehouse solution for a web application project. An important aspect of the entire technological solution is that it is built using cloud tools and services offered by Google. Besides the data warehouse itself, this thesis presents how to connect the data to a data visualization tool and create a dashboard. The thesis has six chapters. The first two chapters are the theoretical part of the thesis, and the remaining four chapters are the practical part. The theoretical part describes the principles of data analytics and Business Intelligence, followed by its components, that usually create Business Intelligence solutions and eventually are presented possible architectures of BI solutions. At the end of the theoretical part are presented the tools, which were used for the implementation of the designed solution in the practical part. The practical part aims to describe the design and its implementation using the tools, which are presented in the theoretical part. The goals of this thesis were to gather requirements for the BI solution, design the data warehouse in the cloud environment using Google Big Query, followed by implementation of the designed solution including the set-up of ETL processes. The last of the goals was to connect the data warehouse to a visualization tool Google Data Studio and create a basic data dashboard.
Keywords: Data; analytics; cloud; data warehouse; data market; Business Intelligence; Big Query; Google Analytics; Data Studio

Information about study

Study programme: Informační systémy a technologie/Business Intelligence
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 8. 10. 2021
Date of submission: 1. 5. 2022
Date of defense: 3. 10. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/78584/podrobnosti

Files for download

    Last update: