Comparison of spatial data indexing techniques

Thesis title: Srovnání technik indexování prostorových dat
Author: Kristín, David
Thesis type: Diplomová práce
Supervisor: Palovská, Helena
Opponents: Hrabě, Pavel
Thesis language: Česky
Abstract:
Diplomová práce se zabývá srovnáním různých přístupů k indexování prostorových dat v DBMS. Reprezentační vzorek systémů řízení báze dat tvoří MySQL, SQLite a PostgreSQL, resp. jejich různé implementace prostorových indexů R-tree, R*-tree, GiST a SP-GiST. Jednotlivé přístupy jsou evaluovány na základě otevřených datových sad pocházejících z Národního katalogu otevřených dat (NKOD) a dat o nemovitostech z inzertního portálu Sreality jak z hlediska výpočetní náročnosti. Práce je rozdělena na část shrnující teoretické poznatky a postupy a část praktickou, v níž se tyto poznatky a postupy využívají. První část představuje definici, náležitosti a funkce geografického informačního systému a prostorových databázových systémů, způsoby reprezentace bez- až vícedimenzionálních objektů a obecné principy fungování uvedených indexů a nad nimi prováděných databázových operací. Praktická část zachycuje samotné získávání porovnávatelných dat pomocí benchmarkingu prostorových operací, najmě prostorových relací, vycházejících z DE-9IM modelu, pomocných funkcí a speciálních algoritmů, zahrnujíce například hledání nejbližšího sousedního bodu (nearest neighbor search), za využití připravené ukázkové databáze agregující rozličné datové sady. Výstupem jsou použité testovací skripty a přehledová matice klasifikována dle definovaných kritérií a naměřených hodnot pro každý DBMS, která může být pro čtenáře podkladem pro výběr ideálního systému řízení báze dat, resp. typu indexu pro jím požadovaný případ užití.
Keywords: prostorový index; b-tree; r-tree; geografický informační systém; gis; prostorová databáze; r*-tree; gist; sp-gist
Thesis title: Comparison of spatial data indexing techniques
Author: Kristín, David
Thesis type: Diploma thesis
Supervisor: Palovská, Helena
Opponents: Hrabě, Pavel
Thesis language: Česky
Abstract:
The diploma thesis deals with the comparison of different approaches to indexing spatial data in DBMS. A representative sample of database management systems consists of MySQL, SQLite and PostgreSQL, respectively their various implementations of the spatial indexes R-tree, R*-tree, GiST and SP-GiST. Individual approaches are evaluated on the basis of open data sets originating from the Národní katalog otevřených dat (NKOD) and real estate data from the Sreality advertising portal, both in terms of computational complexity. The work is divided into a part summarizing theoretical knowledge and procedures and a practical part, in which these knowledge and procedures are used. The first part presents the definition, requisites and functions of geographic information system and spatial database systems, methods of representation of multidimensional objects and general principles of operation of these indexes and database operations performed on them. The practical part captures the acquisition of comparable data using benchmarking of spatial operations, especially spatial relations, based on the DE-9IM model, utility functions and special algorithms, including the nearest neighbor search, using a prepared sample database aggregating various data sets. The output is used test scripts and an overview matrix classified according to defined criteria and measured values for each DBMS, which can be the basis for the reader to select the ideal database management system, respectively the type of index for the use case the reader requires.
Keywords: geographical information system; gis; spatial database; spatial index; b-tree; r-tree; r*-tree; gist; sp-gist

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 4. 10. 2019
Date of submission: 6. 12. 2021
Date of defense: 26. 1. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/71067/podrobnosti

Files for download

    Last update: