Comparison of database systems HeavyDB and Oracle using the TPC-H benchmark
Thesis title: | Porovnání databázových systému HeavyDB a Oracle pomocí TPC-H benchmarku |
---|---|
Author: | Chlomek, Dominik |
Thesis type: | Bakalářská práce |
Supervisor: | Kučera, Jan |
Opponents: | Palovská, Helena |
Thesis language: | Česky |
Abstract: | Cílem této práce je výkonnostní porovnání databázových systémů Oracle a HeavyDB, kde databázový systém HeavyDB od společnosti Heavy.ai byl vybrán jako zástupce GPU akcelerujících SŘBD systémů, které využívají hybridní architektury CPU a GPU pro zpracovávání dat. Oracle verze 19C je v tomto porovnání jako zástupce jednoho z nejznámějších databázových systémů tradičního SŘBD. Zvoleným benchmarkem je TPC-H, jehož hlavní metrikou je počet zpracovaných dotazů za hodinu. V práci je nejprve popsáno provádění rešerše, postup řešení práce a použité metody. Následuje seznámení s GPU akcelerujícími SŘBD systémy a poté představení SŘBD systémů u konkrétních databázový systémů. V dalších kapitolách je představen TPC-H benchmark od společnosti TPC a jeho dílčí testy. Dále je popsána jeho implementace v jednotlivých databázových systémech, která se skládala z nainstalování systémů, vygenerování datasetů, vytvoření testovacího prostředí, úpravy dotazů pro jednotlivé databázové systémy a následné optimalizace prostředí. Ve výkonnostním testování TPC-H benchmarku, který byl otestován na datasetu o velikosti 10 GB, dosáhl databázový systém HeavyDB lepších výsledků. HeavyDB získal v hlavní metrice průměrně 2,39krát více QphH než Oracle. |
Keywords: | TPC-H; výkonnostní porovnání databázových systémů; Oracle; HeavyDB; SŘBD; RDBMS; GPU; GPU akcelerované SŘBD |
Thesis title: | Comparison of database systems HeavyDB and Oracle using the TPC-H benchmark |
---|---|
Author: | Chlomek, Dominik |
Thesis type: | Bachelor thesis |
Supervisor: | Kučera, Jan |
Opponents: | Palovská, Helena |
Thesis language: | Česky |
Abstract: | The main goal of this thesis is a performance comparison of Oracle and HeavyDB database systems, where HeavyDB database system by Heavy.ai was selected as a representative of GPU accelerated DBMS systems that use hybrid CPU and GPU architectures for data processing. In this comparison, Oracle represents one of the most well-known traditional DBMS database systems. The chosen benchmark was TPC-H, whose main metric is the number of queries processed per hour. The thesis first describes the literature review and the research approach. This is followed by an introduction to GPU accelerated DBMSs and then an introduction to DBMSs for specific database systems. In the following chapters, the TPC-H benchmark by TPC and its subtests are introduced. Next, its implementation in each database system is described, which consisted of installing the systems, generating datasets, creating a test environment, modifying queries for each database system, and then optimizing the environment. In the performance testing of the TPC-H benchmark, which was tested on a 10 GB dataset, the HeavyDB database outperformed Oracle. HeavyDB was able to score on average 2.39 times more QphH than Oracle in the main metric. |
Keywords: | Oracle; HeavyDB; DBMS; RDBMS; performance comparison of database systems; TPC-H; GPU; GPU Accelerated DBMS |
Information about study
Study programme: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 3. 1. 2022 |
---|---|
Date of submission: | 8. 5. 2022 |
Date of defense: | 14. 6. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/79204/podrobnosti |