Comparison of commercial deduplication solutions for data backup

Thesis title: Srovnání komerčních deduplikačních řešení pro střednědobé zálohy dat
Author: Bernas, Karel
Thesis type: Diplomová práce
Supervisor: Pour, Jan
Opponents: Pavlíčková, Jarmila
Thesis language: Česky
Abstract:
Diplomová práce zpracovává téma deduplikace dat, primárně u střednědobých záloh, na bázi komerčních řešení. Do tohoto okruhu se nepočítají principy deduplikace používané u diskových polí. Práce konkrétně představuje možnosti deduplikace, které slouží jako ukázka, proč bylo nutné přijít s jejich vylepšeným řešením. Tím řešením je zde metoda sparse indexing, která vznikla v laboratořích Hewlett Packard s.r.o. Tato metoda je zde podrobněji rozebrána a ukázána, v jakém řešení se konkrétně vyskytuje. V návaznosti na analýzu metody sparse indexing se potom vyhodnocuje konkrétní řešení záloh a deduplikace od společnosti HP v porovnání s řešením, které nabízí konkurence. Závěrem je zhodnocení a komentář dosažených výsledků společně s obecnými doporučeními a best practices z reálného provozu rozsáhlých datových struktur. Tato doporučení jsou formulována jako specifikace konkrétních provozních úloh souvisejících s deduplikačními přístupy a postupy.
Keywords: Sparse indexing; Archivace; Zálohování; Deduplikace dat; Amavar; StoreOnce
Thesis title: Comparison of commercial deduplication solutions for data backup
Author: Bernas, Karel
Thesis type: Diploma thesis
Supervisor: Pour, Jan
Opponents: Pavlíčková, Jarmila
Thesis language: Česky
Abstract:
Thesis focuses on data deduplication, mainly in medium-term advances, using commercial solutions. Principles used in disk arrays deduplication are not part of this document. The thesis specifically shows a brief introduction to deduplication, which serves as an example of why it was necessary to come up with an improved solution. This solution is sparse indexing method, which was created in the laboratories of Hewlett Packard Ltd. This method is discussed in more detail and shown in which solutions specifically can be found. Following the analysis of sparse indexing method is the evaluation of a particular solution of backup and deduplication from HP in comparison with a solution that offers some of its competitors. At the end, there is the evaluation and commentary of the results, together with the general recommendations and best practices from a real, large-scale, data structures. These recommendations are put as specifications for particular operational tasks associated with deduplication approaches and procedures.
Keywords: StoreOnce; Sparse indexing; Data deduplication; Archivation; Backup; Amavar

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 11. 10. 2016
Date of submission: 30. 4. 2017
Date of defense: 30. 5. 2017
Identifier in the InSIS system: https://insis.vse.cz/zp/59141/podrobnosti

Files for download

    Last update: