Optimalizace ETL procesů

Název práce: Optimalizace ETL procesů
Autor(ka) práce: Huňa, Tomáš
Typ práce: Bakalářská práce
Vedoucí práce: Pour, Jan
Oponenti práce: Novotný, Ota
Jazyk práce: Česky
Abstrakt:
Bakalářská práce se věnuje optimalizaci ETL procesů, tj. procesu extrakce, transformace a nahrání datového skladu. Jedná se o optimalizaci výkonu ETL. Cílem práce je prozkoumat možnosti optimalizace jednotlivých fází ETL procesu, popsat doporučení, postupy, rady, poznatky, které pozitivně ovlivňují výkonnost, a shrnout vše do jednoho celku prezentovaného v českém jazyce. Práce se skládá ze tří kapitol. První kapitola je věnována základnímu popisu ETL, způsobům, jak odhadnout dobu práce, a možnostem měření výkonu každé fáze. Další část je zaměřena na samostatnou optimalizaci. Zde jsou uvedeny rady, postupy, doporučení jak pro celé ETL, tak pro každou jednotlivou fázi. Poslední kapitola je věnována paralelnímu zpracování, které může být uplatněno ve všech fázích ETL.
Klíčová slova: paralelní zpracování; optimalizace; MS SQL Server; ETL; Business Intelligence; Datový sklad; SSIS
Název práce: Optimization of ETL processes
Autor(ka) práce: Huňa, Tomáš
Typ práce: Bachelor thesis
Vedoucí práce: Pour, Jan
Oponenti práce: Novotný, Ota
Jazyk práce: Česky
Abstrakt:
This bachelor's thesis deals with optimization of ETL processes; it is extraction, transformation and load of data warehouse. It is about performance optimization of ETL. The aim of the thesis is to explore ways the particular ETL phases can be optimized, to describe recommendations, methods, suggestions and findings, which can positively affect performance, and to summarize everything into one piece in Czech. The thesis is divided into three chapters. The first chapter deals with basic description of ETL, ways how to estimate duration of processing, and ways how to measure performance of each phase of ETL. Next part is aimed at optimization. Suggestions, methods and recommendations are introduced both for whole ETL and for every single process; extraction, transformation and load. The last chapter is about parallel processing, which can be applied to all ETL processes.
Klíčová slova: SSIS; MS SQL Server; optimization; parallel processing; Business Intelligence; Data Warehouse; ETL

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 3. 3. 2010
Datum podání práce: 30. 4. 2010
Datum obhajoby: 23. 8. 2010
Identifikátor v systému InSIS: https://insis.vse.cz/zp/25385/podrobnosti

Soubory ke stažení

    Poslední aktualizace: