Comparison of distributed "NoSQL" databases with focus on performance and scalability
Thesis title: | Srovnání distribuovaných "NoSQL" databází s důrazem na výkon a škálovatelnost |
---|---|
Author: | Vrbík, Tomáš |
Thesis type: | Diplomová práce |
Supervisor: | Šlajchrt, Zbyněk |
Opponents: | Pavlíček, Luboš |
Thesis language: | Česky |
Abstract: | Tato práce se zaměřuje na NoSQL databázové systémy. Tyto systémy v současnosti slouží jako doplněk nikoliv jako náhrada relačních databázových systémů. Cílem této práce je srovnat 4 vybrané NoSQL databázové systémy (MongoDB, Apache Cassandra, Apache HBase a Redis) s důrazem na jejich výkon a škálovatelnost. Výkon je srovnáván s využitím simulované zátěže v prostředí čtyřčlenného clusteru. Součástí srovnání dle výkonu je i jedna relační SQL databáze za účelem porovnání klasického a moderního přístupu k uchování strukturovaných dat. Výsledkem srovnání je zjištění, že neexistuje jeden nejlepší databázový systém, protože každý ze srovnávaných systému je vhodný pro jiné produkční nasazení. |
Keywords: | výkon; MySQL; Redis; Cassandra; NoSQL; škálovatelnost; srovnání; distribuovaná databáze; Hadoop; HBase; MongoDB |
Thesis title: | Comparison of distributed "NoSQL" databases with focus on performance and scalability |
---|---|
Author: | Vrbík, Tomáš |
Thesis type: | Diploma thesis |
Supervisor: | Šlajchrt, Zbyněk |
Opponents: | Pavlíček, Luboš |
Thesis language: | Česky |
Abstract: | This paper focuses on NoSQL database systems. These systems currently serve rather as supplement than replacement of relational database systems. The aim of this paper is to compare 4 selected NoSQL database systems (MongoDB, Apache Cassandra, Apache HBase and Redis) with a main focus on performance and scalability. Performance comparison is done using simulated workload in a 4 nodes cluster environment. One relational SQL database is also benchmarked to provide comparison between classic and modern way of maintaining structured data. As the result of comparison I found out that none of these database systems can be labeled as "the best" as each of the compared systems is suitable for different production deployment. |
Keywords: | scalability; distributed database; NoSQL; performance; comparison; Hadoop; MongoDB; MySQL; Redis; HBase; Cassandra |
Information about study
Study programme: | Aplikovaná informatika/Informační systémy a technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information Technologies |
Information on submission and defense
Date of assignment: | 9. 12. 2011 |
---|---|
Date of submission: | 22. 6. 2012 |
Date of defense: | 29. 8. 2012 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/35048/podrobnosti |