Storing hierarchical and unstructured data with Java Content Repository

Thesis title: Uložení hierarchických dat a nestrukturovaných dat s využitím Java Content Repository
Author: Pytelka, Petr
Thesis type: Bakalářská práce
Supervisor: Pavlíčková, Jarmila
Opponents: Feuerlicht, Jiří
Thesis language: Česky
Abstract:
Práce podává přehled možností uložení hierarchických a nestrukturovaných dat, které poskytují standardy JSR-170 a JSR-283 - "Content Repository for Java". Východiskem práce je v první části teorie grafů, na jejímž základě autor definuje termín hierarchických dat. Zde jsou také ukázány další metody ukládání dat od souborových systémů, databázových systémů až po systémy správy dokumentů. Popis standardu JSR-283 v další části přináší detailnější pohled na jeho možnosti. Následně je provedeno srovnání možnosti relačních, objektově-relačních databází a možnosti, které poskytují jednotlivé techniky objektově relačního mapování. Detailnější pohled je věnován referenční implementaci JackRabbit. Jsou na ní ukázány základy práce s příslušným API. Součástí práce je také případová studie, v níž je realizována vnitřní část systému správy dokumentů. Na této studii jsou provedena měření výkonosti referenční implementace JackRabbit. Vyústěním práce je vytvoření sady kritérií, kdy je vhodné využít pro uložení hierarchických a nestrukturovaných dat repozitář dle standardu JSR-170/283, případně přímo implementaci JackRabbit.
Keywords: JackRabbit; JSR-283; hierarchická data; databáze; repozitář; stromová struktura; Java; teorie grafů; JSR-170; nestrukturovaná data
Thesis title: Storing hierarchical and unstructured data with Java Content Repository
Author: Pytelka, Petr
Thesis type: Bachelor thesis
Supervisor: Pavlíčková, Jarmila
Opponents: Feuerlicht, Jiří
Thesis language: Česky
Abstract:
This paper discusses the possibilities of storing hierarchical and unstructured data using standards JSR-170 and JSR-283 - "Content Repository for Java". Background of this paper is the graph theory. A definition of hierarchical data that is based on this theory is presented in the paper. Other methods of storing data such as the file-system, the database systems and the content management systems are discussed. The paper provides a detailed description of standard JSR-283 itself and the available features thereof. This is followed by a comparison of relation-, object-relational databases and the features of the individual techniques of object-relational mapping. Reference implementation JackRabbit is described in detail. It includes the description of the relevant API and its configuration. A case study dealing with the realization of the internal structure of a document management system is a part of this paper. Some performance tests were carried out on the reference implementation; the results thereof are presented in the paper. The conclusion of the work provides for a set of criteria to determine situations where it is appropriate to use a repository compatible with JSR-170/283 to store hierarchical and unstructured data, or where reference implementation JackRabbit can be used.
Keywords: Java; hierarchical data; JSR-170; tree structure; graph theory; semi-structured data; unstructured data; database; JackRabbit; repository; JSR-283

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 14. 7. 2010
Date of submission: 5. 12. 2010
Date of defense: 20. 1. 2011
Identifier in the InSIS system: https://insis.vse.cz/zp/27133/podrobnosti

Files for download

    Last update: