Cloud Business Intelligence

Thesis title: BI řešení v cloudovém prostředí
Author: Kudera, Josef
Thesis type: Diplomová práce
Supervisor: Sládek, Pavel
Opponents: Maryška, Miloš
Thesis language: Česky
Abstract:
V práci se zabývám návrhem business intelligence řešení v cloudovém prostředí pro střední firmu. Jako vhodný přístup k tvorbě datového skladu jsem zvolil postupné budování datových tržišť propojených společnými dimenzemi. Při tvorbě jsem se inspiroval metodikou implementace dle R. Kimballa, ale upravil jsem ji pro potřeby projektu menšího rozsahu budovaného v cloudu. Nejdříve jsem zjistil potřeby a požadavky na výsledné řešení pomocí rozhovorů a zjistil dostupnost a kvalitu dat ve zdrojových systémech. Dále jsem navrhl architekturu řešení využívající ELT přístup a vybral vhodné produkty: Cloud Data Fusion, Keboola, BigQuery, Dataform, Looker Studio a Colab. Následně jsem navrhl dimenzionální model pro prioritní požadavek. Dále jsem navrhl strukturu BigQuery databáze a navrhl datové pumpy a vytvořil je pomocí Dataform frameworku. Posledními kroky byl návrh a implementace reportu a vytvoření dokumentace. Výsledkem je funkční řešení, které splňuje zjištěné potřeby, a první implementovaný požadavek od napojení datových zdrojů až po datové tržiště a výsledný report v Looker Studio. Zvolená architektura a použité produkty mohou být zejména díky dobré škálovatelnosti a nízkým vstupním i provozním nákladům využity pro mnoho dalších firem či organizací.
Keywords: BI; business intelligence; cloud; dimenzionální modelování; ELT
Thesis title: Cloud Business Intelligence
Author: Kudera, Josef
Thesis type: Diploma thesis
Supervisor: Sládek, Pavel
Opponents: Maryška, Miloš
Thesis language: Česky
Abstract:
In this thesis, I design a business intelligence solution in a cloud for a medium-sized company. As a suitable approach to creating a data warehouse, I chose the incremental building of data markets connected by conformed dimensions. I was inspired by the implementation methodology by R. Kimball, but I modified it for the needs of a smallerscale project built in the cloud. First, I determined the needs and requirements for the BI solution through interviews and determined the availability and quality of data in the source systems. Furthermore, I designed the architecture of the solution using the ELT approach and selected the appropriate products: Cloud Data Fusion, Keboola, BigQuery, Dataform, Looker Studio, and Colab. Subsequently, I designed a dimensional model for the priority requirement. Next, I designed the structure of the BigQuery database, designed the data pumps, and developed them using the Dataform framework. The last steps were the report's design and implementation and the documentation creation. The result is a functional solution that meets the identified needs and the first implemented requirement from connecting data sources to the data marketplace and the resulting report in Looker Studio. The chosen architecture and used products can be used by many other companies or organizations, mainly thanks to good scalability and low input and operating costs.
Keywords: cloud; dimensional modeling; ELT; BI; business intelligence

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 25. 1. 2023
Date of submission: 30. 4. 2023
Date of defense: 9. 6. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/83644/podrobnosti

Files for download

    Last update: