Teradata: Application of MVC and BLC on data warehouse
Thesis title: | Aplikace komprese nad datovým skladem od Teradaty |
---|---|
Author: | Bednář, Josef |
Thesis type: | Diplomová práce |
Supervisor: | Pour, Jan |
Opponents: | Gála, Libor |
Thesis language: | Česky |
Abstract: | Téma práce bylo zvoleno v rámci snahy společnosti o lepší optimalizaci datového skladu. Z důvodu změny ETL procesu, kde se hlavní část zpracování přesunulo pod databázový systém Teradaty bylo vhodné provést optimalizaci jak výkonovou tak i kapacitní. V první části práce je popsán koncept Teradata a její architektura. Většímu prostoru v práci dostaly Statistiky, které spadají pod výkoností optimalizaci systému. Hlavní část pak pojednává o kompresích, kterých má Teradata k dispozici několik druhů. V praktické části je přímo provedena aplikace Multi-value komprese na základě získaného nástroje. Pro správnou funkčnost generovaných skriptů byla nutná jejich úprava a zároveň bylo provedeno i reportování chyb a komunikace s vývojovým týmem. V závěru došlo k nasazení komprese na vývojové prostředí a porovnání s odhadem. V rámci blokové komprese byly vytipovány vhodné tabulky, provedena zkušební aplikace komprese a závěrečné doporučení. |
Keywords: | BLC; EDW; KOMPRESE; TERADATA; MVC; STATISTIKY |
Thesis title: | Teradata: Application of MVC and BLC on data warehouse |
---|---|
Author: | Bednář, Josef |
Thesis type: | Diploma thesis |
Supervisor: | Pour, Jan |
Opponents: | Gála, Libor |
Thesis language: | Česky |
Abstract: | The topic of the thesis has been chosen based on efforts of an unnamed company for better data warehouse optimisation. Since the ETL process at the company has been changed, which led to the migration to Teradata database system, it would be appropriate to perform both the operation optimisation, as well as capacity optimisation. The first part of the thesis describes the Teradata concept and its architecture. This part particularly focuses on the Statistics which belong to the system operation optimisation. The main part of the thesis subsequently deals with Compression. Teradata uses several types of compression. The practical part brings the application of Multi Value Compression which has been performed via an appropriate tool. In order for the generated scripts to work correctly, they had to be adjusted. Additionally, defect reporting was performed and the communication with the development team also took place. The results of the table compression is compared with the estimations. The compression was applied on the production environment. The BLC process consisted of appropriate tables identification and compression testing. Based on the results of the testing, recommendations have been established. |
Keywords: | MVC; EDW; STATISTICS; BLC; TERADATA |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 5. 10. 2015 |
---|---|
Date of submission: | 30. 4. 2016 |
Date of defense: | 30. 1. 2017 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/54483/podrobnosti |