Comparison of distributed "NoSQL" databases with focus on performance and scalability

Thesis title: Srovnání distribuovaných "NoSQL" databází s důrazem na výkon a škálovatelnost
Author: Vrbík, Tomáš
Thesis type: Diplomová práce
Supervisor: Šlajchrt, Zbyněk
Opponents: Pavlíček, Luboš
Thesis language: Česky
Abstract:
Tato práce se zaměřuje na NoSQL databázové systémy. Tyto systémy v současnosti slouží jako doplněk nikoliv jako náhrada relačních databázových systémů. Cílem této práce je srovnat 4 vybrané NoSQL databázové systémy (MongoDB, Apache Cassandra, Apache HBase a Redis) s důrazem na jejich výkon a škálovatelnost. Výkon je srovnáván s využitím simulované zátěže v prostředí čtyřčlenného clusteru. Součástí srovnání dle výkonu je i jedna relační SQL databáze za účelem porovnání klasického a moderního přístupu k uchování strukturovaných dat. Výsledkem srovnání je zjištění, že neexistuje jeden nejlepší databázový systém, protože každý ze srovnávaných systému je vhodný pro jiné produkční nasazení.
Keywords: výkon; MySQL; Redis; Cassandra; NoSQL; škálovatelnost; srovnání; distribuovaná databáze; Hadoop; HBase; MongoDB
Thesis title: Comparison of distributed "NoSQL" databases with focus on performance and scalability
Author: Vrbík, Tomáš
Thesis type: Diploma thesis
Supervisor: Šlajchrt, Zbyněk
Opponents: Pavlíček, Luboš
Thesis language: Česky
Abstract:
This paper focuses on NoSQL database systems. These systems currently serve rather as supplement than replacement of relational database systems. The aim of this paper is to compare 4 selected NoSQL database systems (MongoDB, Apache Cassandra, Apache HBase and Redis) with a main focus on performance and scalability. Performance comparison is done using simulated workload in a 4 nodes cluster environment. One relational SQL database is also benchmarked to provide comparison between classic and modern way of maintaining structured data. As the result of comparison I found out that none of these database systems can be labeled as "the best" as each of the compared systems is suitable for different production deployment.
Keywords: scalability; distributed database; NoSQL; performance; comparison; Hadoop; MongoDB; MySQL; Redis; HBase; Cassandra

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 9. 12. 2011
Date of submission: 22. 6. 2012
Date of defense: 29. 8. 2012
Identifier in the InSIS system: https://insis.vse.cz/zp/35048/podrobnosti

Files for download

    Last update: