Architecture and System Implementation of Statistical Confidentiality Management for Regulatory Data in an Oracle Data Warehouse

Thesis title: Architektura a systémová implementace řízení statistické důvěrnosti regulatorních dat v Oracle data warehouse
Author: Pelant, Ondřej
Thesis type: Bakalářská práce
Supervisor: Potančok, Martin
Opponents: Holub, Jan
Thesis language: Česky
Abstract:
Cílem této bakalářské práce je navrhnout a implementovat technické řešení pro plně automatizovanou aplikaci pravidel statistické důvěrnosti na agregovaná regulatorní data v rámci projektu AnaCredit. Práce se zaměřuje na efektivní algoritmizaci pravidla dominance (identifikace dvou největších subjektů) a pravidla četnosti (minimální počet subjektů v agregátu) přímo na úrovni databáze Oracle. Využitím pokročilých analytických funkcí řešení spolehlivě zamezuje přímé i nepřímé identifikaci vykazujících subjektů. Navržená ELT architektura je orchestrována nástrojem Oracle Data Integrator, zajišťuje detailní auditovatelnost procesů a garantuje nepřetržitou dostupnost dat koncovým uživatelům prostřednictvím asynchronního přepínání tabulek. V závěrečné fázi je prokázána vysoká propustnost systému nad masivním datovým vzorkem s více než 21 miliony záznamů, kdy cílené nasazení optimalizačních technik, jako je paralelní zpracování, intervalový partitioning a bitmapové indexy, snížilo celkovou dobu výpočtu o 80 %. Navržené řešení bylo expertně validováno věcnou správou projektu AnaCredit a vývojovým týmem datového skladu ČNB a následně nasazeno do produkčního prostředí, kde zajišťuje výpočet statistické důvěrnosti pro tři analytické sestavy využívané vykazujícími komerčními bankami.
Keywords: ELT architektura; pravidlo dominance; statistická důvěrnost; AnaCredit; Oracle Data Warehouse; databázová optimalizace; analytické funkce; datová integrace
Thesis title: Architecture and System Implementation of Statistical Confidentiality Management for Regulatory Data in an Oracle Data Warehouse
Author: Pelant, Ondřej
Thesis type: Bachelor thesis
Supervisor: Potančok, Martin
Opponents: Holub, Jan
Thesis language: Česky
Abstract:
The main objective of this bachelor's thesis is to design and implement a technical solution for the fully automated application of statistical confidentiality rules to aggregated regulatory data within the AnaCredit project. The thesis focuses on the efficient algorithmization of the dominance rule (identifying the two largest entities) and the frequency rule (minimum number of entities in an aggregate) directly at the Oracle database level. By utilizing advanced analytic functions, the solution reliably prevents both direct and indirect identification of reporting entities. The proposed ELT architecture is orchestrated by Oracle Data Integrator, ensuring detailed process auditability and guaranteeing continuous data availability for end users through asynchronous table switching. In the final phase, the high throughput of the system is demonstrated on a massive dataset with over 21 million records, where the targeted deployment of optimization techniques, such as parallel execution, interval partitioning, and bitmap indexes, reduced the total calculation time by 80%. The proposed solution was expertly validated by the AnaCredit business owners and the data warehouse development team at the Czech National Bank and subsequently deployed into the production environment, where it ensures the calculation of statistical confidentiality for three analytical reports used by reporting commercial banks.
Keywords: statistical confidentiality; AnaCredit; Oracle Data Warehouse; analytic functions; data integration; ELT architecture; database optimization; dominance rule

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 2. 12. 2025
Date of submission: 8. 5. 2026
Date of defense: 19. 6. 2026
Identifier in the InSIS system: https://insis.vse.cz/zp/95107/podrobnosti

Files for download

    Last update: