Porovnání databázových systému HeavyDB a Oracle pomocí TPC-H benchmarku

Název práce: Porovnání databázových systému HeavyDB a Oracle pomocí TPC-H benchmarku
Autor(ka) práce: Chlomek, Dominik
Typ práce: Bakalářská práce
Vedoucí práce: Kučera, Jan
Oponenti práce: Palovská, Helena
Jazyk práce: Česky
Abstrakt:
Cílem této práce je výkonnostní porovnání databázových systémů Oracle a HeavyDB, kde databázový systém HeavyDB od společnosti Heavy.ai byl vybrán jako zástupce GPU akcelerujících SŘBD systémů, které využívají hybridní architektury CPU a GPU pro zpracovávání dat. Oracle verze 19C je v tomto porovnání jako zástupce jednoho z nejznámějších databázových systémů tradičního SŘBD. Zvoleným benchmarkem je TPC-H, jehož hlavní metrikou je počet zpracovaných dotazů za hodinu. V práci je nejprve popsáno provádění rešerše, postup řešení práce a použité metody. Následuje seznámení s GPU akcelerujícími SŘBD systémy a poté představení SŘBD systémů u konkrétních databázový systémů. V dalších kapitolách je představen TPC-H benchmark od společnosti TPC a jeho dílčí testy. Dále je popsána jeho implementace v jednotlivých databázových systémech, která se skládala z nainstalování systémů, vygenerování datasetů, vytvoření testovacího prostředí, úpravy dotazů pro jednotlivé databázové systémy a následné optimalizace prostředí. Ve výkonnostním testování TPC-H benchmarku, který byl otestován na datasetu o velikosti 10 GB, dosáhl databázový systém HeavyDB lepších výsledků. HeavyDB získal v hlavní metrice průměrně 2,39krát více QphH než Oracle.
Klíčová slova: TPC-H; výkonnostní porovnání databázových systémů; Oracle; HeavyDB; SŘBD; RDBMS; GPU; GPU akcelerované SŘBD
Název práce: Comparison of database systems HeavyDB and Oracle using the TPC-H benchmark
Autor(ka) práce: Chlomek, Dominik
Typ práce: Bachelor thesis
Vedoucí práce: Kučera, Jan
Oponenti práce: Palovská, Helena
Jazyk práce: Česky
Abstrakt:
The main goal of this thesis is a performance comparison of Oracle and HeavyDB database systems, where HeavyDB database system by Heavy.ai was selected as a representative of GPU accelerated DBMS systems that use hybrid CPU and GPU architectures for data processing. In this comparison, Oracle represents one of the most well-known traditional DBMS database systems. The chosen benchmark was TPC-H, whose main metric is the number of queries processed per hour. The thesis first describes the literature review and the research approach. This is followed by an introduction to GPU accelerated DBMSs and then an introduction to DBMSs for specific database systems. In the following chapters, the TPC-H benchmark by TPC and its subtests are introduced. Next, its implementation in each database system is described, which consisted of installing the systems, generating datasets, creating a test environment, modifying queries for each database system, and then optimizing the environment. In the performance testing of the TPC-H benchmark, which was tested on a 10 GB dataset, the HeavyDB database outperformed Oracle. HeavyDB was able to score on average 2.39 times more QphH than Oracle in the main metric.
Klíčová slova: Oracle; HeavyDB; DBMS; RDBMS; performance comparison of database systems; TPC-H; GPU; GPU Accelerated DBMS

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 3. 1. 2022
Datum podání práce: 8. 5. 2022
Datum obhajoby: 14. 6. 2022
Identifikátor v systému InSIS: https://insis.vse.cz/zp/79204/podrobnosti

Soubory ke stažení

    Poslední aktualizace: