Data Lake implementation in Corporate Environment
Thesis title: | Implementace Datového jezera v korporátním prostředí |
---|---|
Author: | Dolejšová, Lenka |
Thesis type: | Diplomová práce |
Supervisor: | Pavlíček, Antonín |
Opponents: | Kalíšek, Michal |
Thesis language: | Česky |
Abstract: | Tato diplomová práce se zabývá problematikou ukládání, zpracování a částečně interpretací dat v prostředí korporátní společnosti. V práci se seznámíme s dějinami potřeby ukládání dat, s vývojem data warehousingu, současnými trendy pro práci s daty a pojmy jako Big Data, Data Lake a některými nástroji pro analýzu dat. Cílem práce je analyzovat implementační projekt z pohledu výběru technologie včetně implementačních kroků v konkrétní společnosti s ohledem na projektové metodiky a teoretické znalosti řízení projektů získané během studia.V teoretické části práce je představen jak pojem Data warehousingu, velkých dat a Datového jezera, tak samotný úvod do zpracování dat a nových oblastí jako jsou například Data monetization. Dále jsou také vysvětleny souvislosti mezi pojmy a některé omyly při překládání anglických výrazů používaných v tomto odvětví. V praktické části se práce věnuje implementačnímu projektu dané společnosti. Analyzuje projektové kroky a přiřazuje praktické zkušenosti k teoretickým znalostem o řízení projektů. Práce čtenáři skýtá celkový obrázek o datech a o způsobu nakládání s nimi v současnosti v bankovním prostředí včetně povědomí o způsobu řízení změnových projektů. |
Keywords: | Big Data; Datové jezero; Data warehousing ; Zpracování dat; Business Intelligence; Data Lake |
Thesis title: | Data Lake implementation in Corporate Environment |
---|---|
Author: | Dolejšová, Lenka |
Thesis type: | Diploma thesis |
Supervisor: | Pavlíček, Antonín |
Opponents: | Kalíšek, Michal |
Thesis language: | Česky |
Abstract: | This diploma thesis considers the problem of storing, analyzing and interpreting of corporate data. The history of storing data, evolution of data warehousing and current trends in Data area such as Big Data, Data Lake and some of the analysis tools will be introduced in this thesis. The goal of this thesis is to analyze the implementation project in a way of choosing the technology including certain implementation steps in the company considering project management methods in comparison with theoretical knowledge absorbed during studies.In the theoretical part, we will go through the concepts of Data Warehousing, Big Data and Data Lake, as well as the introduction to the new ways of data processing, data analysis, and new topics such as data monetization. We can also find the explanation of context among the concepts and frequent mistakes during translating them into the Czech language. In the practical part, the thesis focuses on the implementation project. The focus is also on analyzing the project steps and comparing the practical experience with theoretical knowledge. The thesis gives the reader an overview of data and the way the project management is handled in the banking sector. |
Keywords: | Data processing; Business Intelligence; Big Data; Data Lake; Data warehousing |
Information about study
Study programme: | Aplikovaná informatika/Informační management |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Systems Analysis |
Information on submission and defense
Date of assignment: | 2. 8. 2017 |
---|---|
Date of submission: | 20. 4. 2018 |
Date of defense: | 6. 6. 2018 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/63305/podrobnosti |