Architecture and System Implementation of Statistical Confidentiality Management for Regulatory Data in an Oracle Data Warehouse
| Thesis title: | Architektura a systémová implementace řízení statistické důvěrnosti regulatorních dat v Oracle data warehouse |
|---|---|
| Author: | Pelant, Ondřej |
| Thesis type: | Bakalářská práce |
| Supervisor: | Potančok, Martin |
| Opponents: | Holub, Jan |
| Thesis language: | Česky |
| Abstract: | Cílem této bakalářské práce je navrhnout a implementovat technické řešení pro plně automatizovanou aplikaci pravidel statistické důvěrnosti na agregovaná regulatorní data v rámci projektu AnaCredit. Práce se zaměřuje na efektivní algoritmizaci pravidla dominance (identifikace dvou největších subjektů) a pravidla četnosti (minimální počet subjektů v agregátu) přímo na úrovni databáze Oracle. Využitím pokročilých analytických funkcí řešení spolehlivě zamezuje přímé i nepřímé identifikaci vykazujících subjektů. Navržená ELT architektura je orchestrována nástrojem Oracle Data Integrator, zajišťuje detailní auditovatelnost procesů a garantuje nepřetržitou dostupnost dat koncovým uživatelům prostřednictvím asynchronního přepínání tabulek. V závěrečné fázi je prokázána vysoká propustnost systému nad masivním datovým vzorkem s více než 21 miliony záznamů, kdy cílené nasazení optimalizačních technik, jako je paralelní zpracování, intervalový partitioning a bitmapové indexy, snížilo celkovou dobu výpočtu o 80 %. Navržené řešení bylo expertně validováno věcnou správou projektu AnaCredit a vývojovým týmem datového skladu ČNB a následně nasazeno do produkčního prostředí, kde zajišťuje výpočet statistické důvěrnosti pro tři analytické sestavy využívané vykazujícími komerčními bankami. |
| Keywords: | ELT architektura; pravidlo dominance; statistická důvěrnost; AnaCredit; Oracle Data Warehouse; databázová optimalizace; analytické funkce; datová integrace |
| Thesis title: | Architecture and System Implementation of Statistical Confidentiality Management for Regulatory Data in an Oracle Data Warehouse |
|---|---|
| Author: | Pelant, Ondřej |
| Thesis type: | Bachelor thesis |
| Supervisor: | Potančok, Martin |
| Opponents: | Holub, Jan |
| Thesis language: | Česky |
| Abstract: | The main objective of this bachelor's thesis is to design and implement a technical solution for the fully automated application of statistical confidentiality rules to aggregated regulatory data within the AnaCredit project. The thesis focuses on the efficient algorithmization of the dominance rule (identifying the two largest entities) and the frequency rule (minimum number of entities in an aggregate) directly at the Oracle database level. By utilizing advanced analytic functions, the solution reliably prevents both direct and indirect identification of reporting entities. The proposed ELT architecture is orchestrated by Oracle Data Integrator, ensuring detailed process auditability and guaranteeing continuous data availability for end users through asynchronous table switching. In the final phase, the high throughput of the system is demonstrated on a massive dataset with over 21 million records, where the targeted deployment of optimization techniques, such as parallel execution, interval partitioning, and bitmap indexes, reduced the total calculation time by 80%. The proposed solution was expertly validated by the AnaCredit business owners and the data warehouse development team at the Czech National Bank and subsequently deployed into the production environment, where it ensures the calculation of statistical confidentiality for three analytical reports used by reporting commercial banks. |
| Keywords: | statistical confidentiality; AnaCredit; Oracle Data Warehouse; analytic functions; data integration; ELT architecture; database optimization; dominance rule |
Information about study
| Study programme: | Aplikovaná informatika |
|---|---|
| Type of study programme: | Bakalářský studijní program |
| Assigned degree: | Bc. |
| Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
| Faculty: | Faculty of Informatics and Statistics |
| Department: | Department of Information Technologies |
Information on submission and defense
| Date of assignment: | 2. 12. 2025 |
|---|---|
| Date of submission: | 8. 5. 2026 |
| Date of defense: | 19. 6. 2026 |
| Identifier in the InSIS system: | https://insis.vse.cz/zp/95107/podrobnosti |