Comparison of database systems HeavyDB and Oracle using the TPC-H benchmark

Thesis title: Porovnání databázových systému HeavyDB a Oracle pomocí TPC-H benchmarku
Author: Chlomek, Dominik
Thesis type: Bakalářská práce
Supervisor: Kučera, Jan
Opponents: Palovská, Helena
Thesis language: Česky
Abstract:
Cílem této práce je výkonnostní porovnání databázových systémů Oracle a HeavyDB, kde databázový systém HeavyDB od společnosti Heavy.ai byl vybrán jako zástupce GPU akcelerujících SŘBD systémů, které využívají hybridní architektury CPU a GPU pro zpracovávání dat. Oracle verze 19C je v tomto porovnání jako zástupce jednoho z nejznámějších databázových systémů tradičního SŘBD. Zvoleným benchmarkem je TPC-H, jehož hlavní metrikou je počet zpracovaných dotazů za hodinu. V práci je nejprve popsáno provádění rešerše, postup řešení práce a použité metody. Následuje seznámení s GPU akcelerujícími SŘBD systémy a poté představení SŘBD systémů u konkrétních databázový systémů. V dalších kapitolách je představen TPC-H benchmark od společnosti TPC a jeho dílčí testy. Dále je popsána jeho implementace v jednotlivých databázových systémech, která se skládala z nainstalování systémů, vygenerování datasetů, vytvoření testovacího prostředí, úpravy dotazů pro jednotlivé databázové systémy a následné optimalizace prostředí. Ve výkonnostním testování TPC-H benchmarku, který byl otestován na datasetu o velikosti 10 GB, dosáhl databázový systém HeavyDB lepších výsledků. HeavyDB získal v hlavní metrice průměrně 2,39krát více QphH než Oracle.
Keywords: TPC-H; výkonnostní porovnání databázových systémů; Oracle; HeavyDB; SŘBD; RDBMS; GPU; GPU akcelerované SŘBD
Thesis title: Comparison of database systems HeavyDB and Oracle using the TPC-H benchmark
Author: Chlomek, Dominik
Thesis type: Bachelor thesis
Supervisor: Kučera, Jan
Opponents: Palovská, Helena
Thesis language: Česky
Abstract:
The main goal of this thesis is a performance comparison of Oracle and HeavyDB database systems, where HeavyDB database system by Heavy.ai was selected as a representative of GPU accelerated DBMS systems that use hybrid CPU and GPU architectures for data processing. In this comparison, Oracle represents one of the most well-known traditional DBMS database systems. The chosen benchmark was TPC-H, whose main metric is the number of queries processed per hour. The thesis first describes the literature review and the research approach. This is followed by an introduction to GPU accelerated DBMSs and then an introduction to DBMSs for specific database systems. In the following chapters, the TPC-H benchmark by TPC and its subtests are introduced. Next, its implementation in each database system is described, which consisted of installing the systems, generating datasets, creating a test environment, modifying queries for each database system, and then optimizing the environment. In the performance testing of the TPC-H benchmark, which was tested on a 10 GB dataset, the HeavyDB database outperformed Oracle. HeavyDB was able to score on average 2.39 times more QphH than Oracle in the main metric.
Keywords: Oracle; HeavyDB; DBMS; RDBMS; performance comparison of database systems; TPC-H; GPU; GPU Accelerated DBMS

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 3. 1. 2022
Date of submission: 8. 5. 2022
Date of defense: 14. 6. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/79204/podrobnosti

Files for download

    Last update: