Optimization and standardization of data transformations of the credit risk management model

Thesis title: Optimalizace a standardizace datových transformací modelu pro řízení kreditního rizika
Author: Styblík, Marek
Thesis type: Diplomová práce
Supervisor: Karkošková, Soňa
Opponents: Pour, Jan
Thesis language: Česky
Proces ETL je klíčovým prvkem v moderní práci s daty, který umožňuje získávat, transformovat a nahrávat data do finálních systémů. Tento model je často součástí robustního firemního řešení pro získávání zdrojových dat. Ačkoliv by si mnoho týmů a oddělení přálo více flexibilní provedení, jeho zavedení na bázi agilního přístupu citizenship development s sebou nese určitá rizika. Struktura je náchylná k problémům spojeným s její složitostí a obtížnou správou. Tato diplomová práce se zabývá optimalizací datových transformací psaných v bankovním PL/SQL kódu na základě přístupu citizenship development. Cílem diplomové práce je optimalizovat existující ETL strukturu tak, aby byla lépe organizovaná a jednodušeji pochopitelná. Optimalizace modelu se zaměřuje na restrukturalizaci ETL hierarchie, efektivitu psaného SQL kódu a čištění a organizaci dat dle nejlepších praktik. Práce se také zaměřuje na efektivitu zpracování dat a ošetření hodnot. Na základě těchto principů je pak vyhodnocena datová kvalita. Přínosem této práce je také definice sady praktik postavené na modulárním řešení pro nově vznikající datové sady.
Keywords: BI; CTE; databáze; Git; ETL; PL/SQL
Thesis title: Optimization and standardization of data transformations of the credit risk management model
Author: Styblík, Marek
Thesis type: Diploma thesis
Supervisor: Karkošková, Soňa
Opponents: Pour, Jan
Thesis language: Česky
The ETL process is a key element in modern data handling, allowing data to be extracted, transformed and uploaded into final systems. This model is often part of a robust enterprise solution for data extraction. Although many teams and departments would like to see a more flexible implementation, its adoption based on an agile citizenship development approach carries certain risks. The structure is vulnerable to problems associated with its complexity and difficulty to administer. This thesis deals with the data transformations optimization written in bank PL/SQL code based on the citizenship development approach. The aim of the thesis is to optimize the existing ETL structure in order to make it more organized and easier to understand. The optimization of the model focuses on restructuring the ETL hierarchy, the efficiency of the written SQL code, and data cleaning and organization according to best practices. The work also focuses on the efficiency of data processing and value handling. Data quality is then evaluated based on these principles. The contribution of this thesis is also the definition of a set of best practices built on a modular solution for newly emerging datasets.
Keywords: BI; CTE; database; Git; ETL; PL/SQL

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 20. 3. 2024
Date of submission: 28. 4. 2024
Date of defense: 28. 5. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/88177/podrobnosti

Files for download

Main text
Private file
    Last update: