Comparison of open source database systems

Thesis title: Porovnání open source databázových systémů
Author: Véle, Marek
Thesis type: Bakalářská práce
Supervisor: Palovská, Helena
Opponents: Klas, Jan
Thesis language: Česky
Abstract:
Cílem práce bylo porovnat vybrané open source databázové systémy z teoretického a praktického hlediska a jejich vhodného užití. Pro toto porovnání jsem vybral systémy MySQL, PostgreSQL a MonetDB. Teoretické srovnání se týkalo licencí, pod kterými jsou systémy distribuovány, dostupné podpory, podporovaných platforem, použitelných rozhraní a datových typů. Praktické srovnání porovnávalo základní instalaci a zprovoznění v reálném prostředí a výkon při provádění vybraných SQL dotazů. Jedním z aspektů testování výkonu bylo ověření vlivu architektury uložení dat na rychlost vykonání určitých typů dotazů. Jako hlavní zdroj teoretického srovnání posloužila dokumentace dostupná k porovnávaným systémům a oficiální webové stránky jednotlivých databázových systémů. Praktické porovnání jsem provedl na linuxové platformě. K přístupu k systémům a zadávání SQL dotazů jsem použil standardní rozhraní JDBC. Jako testovací data jsem použil vlastní uspořádání náhodných dat z Open Source Database Benchmark do dvou tabulek. Testovací dotazy jsem formuloval sám za účelem porovnání výkonu databázových systémů celkově a v konkrétních činnostech. Dospěl jsem k závěru, že MySQL je vhodné pro firemní i samostatné uživatele díky široké podpoře, výběru licencí a pestré škále dostupných rozhraní i podporovaných platforem. Jeho výkon je ale v mnohých oblastech v čele se vytvářením indexů a řazením v použité konfiguraci velmi slabý. PostgreSQL sice může odrazovat především firemní uživatele menším výběrem komerční podpory a dodávaných rozhraní, ale tyto problémy jsou z velké části kompenzovány aktivní komunitou, resp. třetími stranami. Výkonově bylo PostgreSQL vynikající, jako vhodné se mi zdá především pro větší datové soubory a je rychlé i v případech, kdy není provedena indexace dat. MonetDB jako málo známé a akademicky vyvíjené nemá mnoho šancí se prosadit mimo zmíněné prostředí jeho původu. Jeho sloupcově orientované uložení dat se ukázalo jako výhodné při výběru velmi malého počtu sloupců. I naprosto bez použití indexů byly všechny testovací dotazy provedeny dobrou rychlostí. Jednotlivé kapitoly teoretické části jsou členěny podle testovaných systémů. Praktická část má jedinou kapitolu členěnou podle postupu provádění. Na konci každé kapitoly se nachází zhodnocení zjištěných skutečností.
Keywords: porovnání; databázové systémy; open source
Thesis title: Comparison of open source database systems
Author: Véle, Marek
Thesis type: Bachelor thesis
Supervisor: Palovská, Helena
Opponents: Klas, Jan
Thesis language: Česky
Abstract:
Goal of this paper was to compare chosen open source database management systems from theoretical and practical point and assess their suitable use. For this comparison I chose MySQL, PostgreSQL and MonetDB database systems. Theoretical comparison involved licenses covering the systems, available support, supported platforms, usable interfaces and data types. In practical comparison I conducted basic installation and configuration in real environment and tested performance of execution of certain SQL queries. One of the aspects of performance testing was to determine the influence of data storing architecture on speed of execution of specific types of queries. Documentation available with the compared systems and official web pages of particular systems served as the main source for theoretical comparison. I conducted the practical part using the linux platform. To access the systems and for the SQL queries input I used the standard JDBC interface. As data for testing I used random data from Open Source Database Benchmark, which I ordered into two similar tables. I defined the test queries myself in order to compare the performance of database systems in whole and in particular fields. I've reached a conclusion that MySQL is suitable for corporate and stand-alone users thanks to wide support, choice of licenses and diversified spectrum of available interfaces and supported platforms. However, its performance in many fields including index creation and ordering of data was very poor in tested configuration. PostgreSQL can indeed discourage mostly corporate users by worse choice of commercial support and interfaces shipped with the system, but these problems are mostly compensated by active community, or third parties. The performance of PostgreSQL was outstanding, I find it suitable for larger data collections and it's fast even in cases when indexing of data didn't take place. MonetDB, as a not well-known while academically developed system, has little chance for a breakthrough outside its field of origin. Its column oriented storage of data proved convenient when selecting very small number of columns. Even without any indexation all test queries were executed with good speed. Individual chapters of the theoretical part are divided based on the compared systems. The practical part only consists of one chapter divided according to order of actions. At the end of each chapter there is evaluation of discovered facts.
Keywords: database systems; open source; comparison

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 3. 10. 2007
Date of submission: 1. 6. 2008
Date of defense: 20. 1. 2009
Identifier in the InSIS system: https://insis.vse.cz/zp/13484/podrobnosti

Files for download

    Last update: