Porovnání databázových systému HeavyDB a Oracle pomocí TPC-H benchmarku
Název práce: | Porovnání databázových systému HeavyDB a Oracle pomocí TPC-H benchmarku |
---|---|
Autor(ka) práce: | Chlomek, Dominik |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Kučera, Jan |
Oponenti práce: | Palovská, Helena |
Jazyk práce: | Česky |
Abstrakt: | Cílem této práce je výkonnostní porovnání databázových systémů Oracle a HeavyDB, kde databázový systém HeavyDB od společnosti Heavy.ai byl vybrán jako zástupce GPU akcelerujících SŘBD systémů, které využívají hybridní architektury CPU a GPU pro zpracovávání dat. Oracle verze 19C je v tomto porovnání jako zástupce jednoho z nejznámějších databázových systémů tradičního SŘBD. Zvoleným benchmarkem je TPC-H, jehož hlavní metrikou je počet zpracovaných dotazů za hodinu. V práci je nejprve popsáno provádění rešerše, postup řešení práce a použité metody. Následuje seznámení s GPU akcelerujícími SŘBD systémy a poté představení SŘBD systémů u konkrétních databázový systémů. V dalších kapitolách je představen TPC-H benchmark od společnosti TPC a jeho dílčí testy. Dále je popsána jeho implementace v jednotlivých databázových systémech, která se skládala z nainstalování systémů, vygenerování datasetů, vytvoření testovacího prostředí, úpravy dotazů pro jednotlivé databázové systémy a následné optimalizace prostředí. Ve výkonnostním testování TPC-H benchmarku, který byl otestován na datasetu o velikosti 10 GB, dosáhl databázový systém HeavyDB lepších výsledků. HeavyDB získal v hlavní metrice průměrně 2,39krát více QphH než Oracle. |
Klíčová slova: | TPC-H; výkonnostní porovnání databázových systémů; Oracle; HeavyDB; SŘBD; RDBMS; GPU; GPU akcelerované SŘBD |
Název práce: | Comparison of database systems HeavyDB and Oracle using the TPC-H benchmark |
---|---|
Autor(ka) práce: | Chlomek, Dominik |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Kučera, Jan |
Oponenti práce: | Palovská, Helena |
Jazyk práce: | Česky |
Abstrakt: | The main goal of this thesis is a performance comparison of Oracle and HeavyDB database systems, where HeavyDB database system by Heavy.ai was selected as a representative of GPU accelerated DBMS systems that use hybrid CPU and GPU architectures for data processing. In this comparison, Oracle represents one of the most well-known traditional DBMS database systems. The chosen benchmark was TPC-H, whose main metric is the number of queries processed per hour. The thesis first describes the literature review and the research approach. This is followed by an introduction to GPU accelerated DBMSs and then an introduction to DBMSs for specific database systems. In the following chapters, the TPC-H benchmark by TPC and its subtests are introduced. Next, its implementation in each database system is described, which consisted of installing the systems, generating datasets, creating a test environment, modifying queries for each database system, and then optimizing the environment. In the performance testing of the TPC-H benchmark, which was tested on a 10 GB dataset, the HeavyDB database outperformed Oracle. HeavyDB was able to score on average 2.39 times more QphH than Oracle in the main metric. |
Klíčová slova: | Oracle; HeavyDB; DBMS; RDBMS; performance comparison of database systems; TPC-H; GPU; GPU Accelerated DBMS |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 3. 1. 2022 |
---|---|
Datum podání práce: | 8. 5. 2022 |
Datum obhajoby: | 14. 6. 2022 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/79204/podrobnosti |