Optimalizace ETL procesů
Název práce: | Optimalizace ETL procesů |
---|---|
Autor(ka) práce: | Huňa, Tomáš |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Pour, Jan |
Oponenti práce: | Novotný, Ota |
Jazyk práce: | Česky |
Abstrakt: | Bakalářská práce se věnuje optimalizaci ETL procesů, tj. procesu extrakce, transformace a nahrání datového skladu. Jedná se o optimalizaci výkonu ETL. Cílem práce je prozkoumat možnosti optimalizace jednotlivých fází ETL procesu, popsat doporučení, postupy, rady, poznatky, které pozitivně ovlivňují výkonnost, a shrnout vše do jednoho celku prezentovaného v českém jazyce. Práce se skládá ze tří kapitol. První kapitola je věnována základnímu popisu ETL, způsobům, jak odhadnout dobu práce, a možnostem měření výkonu každé fáze. Další část je zaměřena na samostatnou optimalizaci. Zde jsou uvedeny rady, postupy, doporučení jak pro celé ETL, tak pro každou jednotlivou fázi. Poslední kapitola je věnována paralelnímu zpracování, které může být uplatněno ve všech fázích ETL. |
Klíčová slova: | paralelní zpracování; optimalizace; MS SQL Server; ETL; Business Intelligence; Datový sklad; SSIS |
Název práce: | Optimization of ETL processes |
---|---|
Autor(ka) práce: | Huňa, Tomáš |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Pour, Jan |
Oponenti práce: | Novotný, Ota |
Jazyk práce: | Česky |
Abstrakt: | This bachelor's thesis deals with optimization of ETL processes; it is extraction, transformation and load of data warehouse. It is about performance optimization of ETL. The aim of the thesis is to explore ways the particular ETL phases can be optimized, to describe recommendations, methods, suggestions and findings, which can positively affect performance, and to summarize everything into one piece in Czech. The thesis is divided into three chapters. The first chapter deals with basic description of ETL, ways how to estimate duration of processing, and ways how to measure performance of each phase of ETL. Next part is aimed at optimization. Suggestions, methods and recommendations are introduced both for whole ETL and for every single process; extraction, transformation and load. The last chapter is about parallel processing, which can be applied to all ETL processes. |
Klíčová slova: | SSIS; MS SQL Server; optimization; parallel processing; Business Intelligence; Data Warehouse; ETL |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 3. 3. 2010 |
---|---|
Datum podání práce: | 30. 4. 2010 |
Datum obhajoby: | 23. 8. 2010 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/25385/podrobnosti |