Optimization of ETL processes
Thesis title: | Optimalizace ETL procesů |
---|---|
Author: | Huňa, Tomáš |
Thesis type: | Bakalářská práce |
Supervisor: | Pour, Jan |
Opponents: | Novotný, Ota |
Thesis language: | Česky |
Abstract: | Bakalářská práce se věnuje optimalizaci ETL procesů, tj. procesu extrakce, transformace a nahrání datového skladu. Jedná se o optimalizaci výkonu ETL. Cílem práce je prozkoumat možnosti optimalizace jednotlivých fází ETL procesu, popsat doporučení, postupy, rady, poznatky, které pozitivně ovlivňují výkonnost, a shrnout vše do jednoho celku prezentovaného v českém jazyce. Práce se skládá ze tří kapitol. První kapitola je věnována základnímu popisu ETL, způsobům, jak odhadnout dobu práce, a možnostem měření výkonu každé fáze. Další část je zaměřena na samostatnou optimalizaci. Zde jsou uvedeny rady, postupy, doporučení jak pro celé ETL, tak pro každou jednotlivou fázi. Poslední kapitola je věnována paralelnímu zpracování, které může být uplatněno ve všech fázích ETL. |
Keywords: | paralelní zpracování; optimalizace; MS SQL Server; ETL; Business Intelligence; Datový sklad; SSIS |
Thesis title: | Optimization of ETL processes |
---|---|
Author: | Huňa, Tomáš |
Thesis type: | Bachelor thesis |
Supervisor: | Pour, Jan |
Opponents: | Novotný, Ota |
Thesis language: | Česky |
Abstract: | This bachelor's thesis deals with optimization of ETL processes; it is extraction, transformation and load of data warehouse. It is about performance optimization of ETL. The aim of the thesis is to explore ways the particular ETL phases can be optimized, to describe recommendations, methods, suggestions and findings, which can positively affect performance, and to summarize everything into one piece in Czech. The thesis is divided into three chapters. The first chapter deals with basic description of ETL, ways how to estimate duration of processing, and ways how to measure performance of each phase of ETL. Next part is aimed at optimization. Suggestions, methods and recommendations are introduced both for whole ETL and for every single process; extraction, transformation and load. The last chapter is about parallel processing, which can be applied to all ETL processes. |
Keywords: | SSIS; MS SQL Server; optimization; parallel processing; Business Intelligence; Data Warehouse; ETL |
Information about study
Study programme: | Aplikovaná informatika/Informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 3. 3. 2010 |
---|---|
Date of submission: | 30. 4. 2010 |
Date of defense: | 23. 8. 2010 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/25385/podrobnosti |