Data Lake implementation in Corporate Environment

Thesis title: Implementace Datového jezera v korporátním prostředí
Author: Dolejšová, Lenka
Thesis type: Diplomová práce
Supervisor: Pavlíček, Antonín
Opponents: Kalíšek, Michal
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá problematikou ukládání, zpracování a částečně interpretací dat v prostředí korporátní společnosti. V práci se seznámíme s dějinami potřeby ukládání dat, s vývojem data warehousingu, současnými trendy pro práci s daty a pojmy jako Big Data, Data Lake a některými nástroji pro analýzu dat. Cílem práce je analyzovat implementační projekt z pohledu výběru technologie včetně implementačních kroků v konkrétní společnosti s ohledem na projektové metodiky a teoretické znalosti řízení projektů získané během studia.V teoretické části práce je představen jak pojem Data warehousingu, velkých dat a Datového jezera, tak samotný úvod do zpracování dat a nových oblastí jako jsou například Data monetization. Dále jsou také vysvětleny souvislosti mezi pojmy a některé omyly při překládání anglických výrazů používaných v tomto odvětví. V praktické části se práce věnuje implementačnímu projektu dané společnosti. Analyzuje projektové kroky a přiřazuje praktické zkušenosti k teoretickým znalostem o řízení projektů. Práce čtenáři skýtá celkový obrázek o datech a o způsobu nakládání s nimi v současnosti v bankovním prostředí včetně povědomí o způsobu řízení změnových projektů.
Keywords: Big Data; Datové jezero; Data warehousing ; Zpracování dat; Business Intelligence; Data Lake
Thesis title: Data Lake implementation in Corporate Environment
Author: Dolejšová, Lenka
Thesis type: Diploma thesis
Supervisor: Pavlíček, Antonín
Opponents: Kalíšek, Michal
Thesis language: Česky
Abstract:
This diploma thesis considers the problem of storing, analyzing and interpreting of corporate data. The history of storing data, evolution of data warehousing and current trends in Data area such as Big Data, Data Lake and some of the analysis tools will be introduced in this thesis. The goal of this thesis is to analyze the implementation project in a way of choosing the technology including certain implementation steps in the company considering project management methods in comparison with theoretical knowledge absorbed during studies.In the theoretical part, we will go through the concepts of Data Warehousing, Big Data and Data Lake, as well as the introduction to the new ways of data processing, data analysis, and new topics such as data monetization. We can also find the explanation of context among the concepts and frequent mistakes during translating them into the Czech language. In the practical part, the thesis focuses on the implementation project. The focus is also on analyzing the project steps and comparing the practical experience with theoretical knowledge. The thesis gives the reader an overview of data and the way the project management is handled in the banking sector.
Keywords: Data processing; Business Intelligence; Big Data; Data Lake; Data warehousing

Information about study

Study programme: Aplikovaná informatika/Informační management
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Systems Analysis

Information on submission and defense

Date of assignment: 2. 8. 2017
Date of submission: 20. 4. 2018
Date of defense: 6. 6. 2018
Identifier in the InSIS system: https://insis.vse.cz/zp/63305/podrobnosti

Files for download

    Last update: