Design and implementation of a data warehouse solution for a web application project
Thesis title: | Návrh a implementace datového skladu v cloudovém prostředí pro projekt webové aplikace vybrané společnosti |
---|---|
Author: | Pěrůžek, Jan |
Thesis type: | Diplomová práce |
Supervisor: | Maryška, Miloš |
Opponents: | Sládek, Pavel |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá návrhem a implementací datového skladu pro projekt webové aplikace. Významným aspektem celého technického řešení je to, že je postavené na cloudových službách, a to sice od společnosti Google. Kromě datového skladu práce pojednává i o napojení dat do vizualizačního nástroje a vytvoření základního dashboardu. Práce je dohromady tvořena šesti kapitolami, přičemž první dvě tvoří teoretickou část této diplomové práce a zbylé čtyři praktickou. V teoretické části je čtenář nejprve seznámen se základními aspekty datové analytiky a Business Intelligence, následně jednotlivými komponentami, ze kterých se typicky skládají Business Intelligence řešení a možnými architekturami pro Business Intelligence. Teoretickou část uzavírá kapitola věnovaná nástrojům, které jsou použity pro realizaci praktického řešení v praktické části. Praktická část se věnuje vlastnímu návrhu řešení a jeho následné implementaci s využitím nástrojů, které jsou představeny v teoretické části. Mezi cíli této práce bylo shromáždit požadavky na výsledné řešení, navrhnout datový sklad v cloudovém prostředí služby Big Query do společnosti Google, následně tento návrh implementovat, a to včetně tvorby datových pump a celkově automatizace zpracování dat a v neposlední řadě vytvořené řešení napojit do vizualizačního nástroje Google Data Studio a vytvořit v něm základní dashboard. |
Keywords: | datový sklad; Data; datové tržiště; Business Intelligence; Big Query; Google Analytics; Data Studio; analytika; cloud |
Thesis title: | Design and implementation of a data warehouse solution for a web application project |
---|---|
Author: | Pěrůžek, Jan |
Thesis type: | Diploma thesis |
Supervisor: | Maryška, Miloš |
Opponents: | Sládek, Pavel |
Thesis language: | Česky |
Abstract: | This thesis focuses on the design and implementation of a data warehouse solution for a web application project. An important aspect of the entire technological solution is that it is built using cloud tools and services offered by Google. Besides the data warehouse itself, this thesis presents how to connect the data to a data visualization tool and create a dashboard. The thesis has six chapters. The first two chapters are the theoretical part of the thesis, and the remaining four chapters are the practical part. The theoretical part describes the principles of data analytics and Business Intelligence, followed by its components, that usually create Business Intelligence solutions and eventually are presented possible architectures of BI solutions. At the end of the theoretical part are presented the tools, which were used for the implementation of the designed solution in the practical part. The practical part aims to describe the design and its implementation using the tools, which are presented in the theoretical part. The goals of this thesis were to gather requirements for the BI solution, design the data warehouse in the cloud environment using Google Big Query, followed by implementation of the designed solution including the set-up of ETL processes. The last of the goals was to connect the data warehouse to a visualization tool Google Data Studio and create a basic data dashboard. |
Keywords: | Data; analytics; cloud; data warehouse; data market; Business Intelligence; Big Query; Google Analytics; Data Studio |
Information about study
Study programme: | Informační systémy a technologie/Business Intelligence |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 8. 10. 2021 |
---|---|
Date of submission: | 1. 5. 2022 |
Date of defense: | 3. 10. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/78584/podrobnosti |