Data integration in large enterprises

Thesis title: Data integration in large enterprises
Author: Nagyová, Barbora
Thesis type: Diploma thesis
Supervisor: Kučera, Jan
Opponents: Chlapek, Dušan
Thesis language: English
Data Integration is currently an important and complex topic for many companies, because having a good and working Data Integration solution can bring multiple advantages over competitors. Data Integration is usually being executed in a form of a project, which might easily turn into failure. In order to decrease risks and negative impact of a failed Data Integration project, there needs to be good project management, Data Integration knowledge and the right technology in place. This thesis provides a framework for setting up a good Data Integration solution. The framework is developed based on the current theory, currently available Data Integration tools and opinions provided by experts working in the field for a minimum of 7+ years and have proven their skills with a successful Data Integration project. This thesis does not guarantee the development of the right Data Integration solution, but it does provide guidance how to deal with a Data Integration project in a large enterprise. This thesis is structured into seven chapters. The first chapter brings an overview about this thesis such as scope, goals, assumptions and expected value. The second chapter describes Data Management and basic Data Integration theory in order to distinguish these two topics and to explain the relationship between them. The third chapter is focused purely on Data Integration theory which should be known by everyone who participates in a Data Integration project. The fourth chapter analyses features of the current Data Integration solutions available on the market and provides an overview of the most common and necessary functionalities. Chapter five focuses on the practical part of this thesis, where the Data Integration framework is designed based on findings from previous chapters and interviews with experts in this field. Chapter six then applies the framework to a real working (anonymized) Data Integration solution, highlights the gap between the framework and the solution and provides guidance how to deal with the gaps. Chapter seven provides a resume, personal opinion and outlook.
Keywords: data management; Data Integration tools; waterfall model; Data Integration; large scale enterprise; framework; Data Integration landscape
Thesis title: Datová integrace ve velkých podnicích
Author: Nagyová, Barbora
Thesis type: Diplomová práce
Supervisor: Kučera, Jan
Opponents: Chlapek, Dušan
Thesis language: English
Datová integrace je v současné době důležité a komplexní téma, týkající se mnoha společností, protože mít kvalitní a fungující řešení datové integrace může přinést mnoho konkurenčních výhod. Zavádění datové integrace obvykle bývá uskutečněno ve formě projektu, který se snadno může obrátit v neúspěch. Ke snížení rizik a negativního dopadu neúspěšného projektu datové integrace je klíčové mít dobrý projektový management, mít potřebné znalosti datové integrace v rámci týmu a použít vhodnou technologii pro dané řešení. V této práci je navržen framework pro vytvoření kvalitního řešení datové integrace. Framework je vyvinutý na základě současné teorie, dostupných nástrojů datové integrace a zkušeností poskytnutých experty pracující v této oblasti více než 7 let, kteří nasbírali své znalosti v úspěšně fungujícím projektu datové integrace. Tato diplomová práce nezaručuje vyvinutí správného řešení datové integrace, avšak poskytuje návod jak se vypořádat s projektem datové integrace pro velké podniky. Práce je strukturovaná do sedmi kapitol. První kapitola zahrnuje přehled o této práci, především vymezení rozsahu, cíle, předpoklady a očekávanou přidanou hodnotu. Druhá kapitola popisuje datový management a základní teorii datové integrace a následně tyto dva pojmy rozlišuje a specifikuje jejich vzájemný vztah. Třetí kapitola je zaměřená čistě na teorii datové integrace, která by měla být známá každému, kdo se podílí na integračním projektu. Čtvrtá kapitola analyzuje vlastnosti současných řešení datové integrace, které jsou dostupné na trhu a poskytuje seznam a přehled nejběžnějších a nezbytných funkcí. Pátá kapitola vstupuje do praktické části této práce, kde je navržen framework datové integrace, založený na zjištěních a závěrech z předchozích kapitol a rozhovorů s experty v této oblasti. Šestá kapitola aplikuje navržený framework do skutečného a fungujícího (anonymizovaného) řešení datové integrace, vyzdvihuje nesoulad komponent řešení a poskytuje návod, jak se vypořádat s mezerami. Závěrečná kapitola poskytuje shrnutí, osobní názor a výhled do budoucnosti.
Keywords: framework; podnik velkého rozsahu; vodopádový model; nástroje datové integrace; oblast datové integrace; řízení dat; Datová integrace

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 13. 10. 2015
Date of submission: 27. 4. 2016
Date of defense: 7. 6. 2016
Identifier in the InSIS system:

Files for download

    Last update: