Implementation of a real-time analytics layer over a data warehouse in the Elasticsearch framework

Thesis title: Realizace real-time analytické vrstvy nad datovým skladem v Elasticsearch frameworku
Author: Dostál, Kryštof
Thesis type: Diplomová práce
Supervisor: Stanovská, Iva
Opponents: Maršálek, Karel
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá návrhem a implementací real-time analytické vrstvy nad datovým skladem v Elasticsearch frameworku. Cílem projektu je ověřit použitelnost Elasticsearch pro migraci tří vybraných agregačních služeb z Oracle databáze a dosáhnout výrazného zlepšení výkonu a škálovatelnosti. Práce popisuje analýzu požadavků, návrh architektury řešení využívající Elasticsearch a Apache Kafka, a implementaci datového toku, indexů a podpůrných nástrojů. Výsledky zátěžových a výkonnostních testů demonstrují úspěšnost migrace, s dosažením až třicetinásobného zrychlení odezvy služeb a lineární škálovatelností. Projekt potvrzuje přínos Elasticsearch pro real-time analýzu velkých objemů dat v podnikovém prostředí.
Keywords: Elasticsearch; real-time analytika; migrace dat
Thesis title: Implementation of a real-time analytics layer over a data warehouse in the Elasticsearch framework
Author: Dostál, Kryštof
Thesis type: Diploma thesis
Supervisor: Stanovská, Iva
Opponents: Maršálek, Karel
Thesis language: Česky
Abstract:
This master's thesis focuses on the design and implementation of a real-time analytical layer on top of a data warehouse using the Elasticsearch framework. The project aims to verify the applicability of Elasticsearch for migrating three selected aggregation services from an Oracle database and achieve significant improvements in performance and scalability. The thesis describes the requirements analysis, the design of a solution architecture utilizing Elasticsearch and Apache Kafka, and the implementation of data flows, indexes, and supporting tools. The results of load and performance tests demonstrate the success of the migration, with up to a 30-fold acceleration in service response times and linear scalability. The project confirms the benefits of Elasticsearch for real-time analysis of large data volumes in an enterprise setting.
Keywords: Elasticsearch; real-time analytics; data migration

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 29. 10. 2023
Date of submission: 29. 4. 2024
Date of defense: 28. 5. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/86303/podrobnosti

Files for download

Main text
Private file
Download
Private annex
Private file
Download
    Last update: