Optimization of ETL processes

Thesis title: Optimalizace ETL procesů
Author: Huňa, Tomáš
Thesis type: Bakalářská práce
Supervisor: Pour, Jan
Opponents: Novotný, Ota
Thesis language: Česky
Abstract:
Bakalářská práce se věnuje optimalizaci ETL procesů, tj. procesu extrakce, transformace a nahrání datového skladu. Jedná se o optimalizaci výkonu ETL. Cílem práce je prozkoumat možnosti optimalizace jednotlivých fází ETL procesu, popsat doporučení, postupy, rady, poznatky, které pozitivně ovlivňují výkonnost, a shrnout vše do jednoho celku prezentovaného v českém jazyce. Práce se skládá ze tří kapitol. První kapitola je věnována základnímu popisu ETL, způsobům, jak odhadnout dobu práce, a možnostem měření výkonu každé fáze. Další část je zaměřena na samostatnou optimalizaci. Zde jsou uvedeny rady, postupy, doporučení jak pro celé ETL, tak pro každou jednotlivou fázi. Poslední kapitola je věnována paralelnímu zpracování, které může být uplatněno ve všech fázích ETL.
Keywords: paralelní zpracování; optimalizace; MS SQL Server; ETL; Business Intelligence; Datový sklad; SSIS
Thesis title: Optimization of ETL processes
Author: Huňa, Tomáš
Thesis type: Bachelor thesis
Supervisor: Pour, Jan
Opponents: Novotný, Ota
Thesis language: Česky
Abstract:
This bachelor's thesis deals with optimization of ETL processes; it is extraction, transformation and load of data warehouse. It is about performance optimization of ETL. The aim of the thesis is to explore ways the particular ETL phases can be optimized, to describe recommendations, methods, suggestions and findings, which can positively affect performance, and to summarize everything into one piece in Czech. The thesis is divided into three chapters. The first chapter deals with basic description of ETL, ways how to estimate duration of processing, and ways how to measure performance of each phase of ETL. Next part is aimed at optimization. Suggestions, methods and recommendations are introduced both for whole ETL and for every single process; extraction, transformation and load. The last chapter is about parallel processing, which can be applied to all ETL processes.
Keywords: SSIS; MS SQL Server; optimization; parallel processing; Business Intelligence; Data Warehouse; ETL

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 3. 3. 2010
Date of submission: 30. 4. 2010
Date of defense: 23. 8. 2010
Identifier in the InSIS system: https://insis.vse.cz/zp/25385/podrobnosti

Files for download

    Last update: