Možnosti přímého zpracování formátů ODF/OOXML v XSLT

Název práce: Možnosti přímého zpracování formátů ODF/OOXML v XSLT
Autor(ka) práce: Sem, Štěpán
Typ práce: Bakalářská práce
Vedoucí práce: Kosek, Jiří
Oponenti práce: Nálevka, Petr
Jazyk práce: Česky
Abstrakt:
Cílem této práce je umožnit pracovat a archivy XML dokumentů a souvisejících dat přímo pomocí XML nástrojů, například XSLT procesorů. Zejména se jedná o zpracování ODF a OOXML formátů. Celý archiv bude reprezentován jediným XML dokumentem, který bude přímo obsahovat XML dokumenty z vnitřku archivu a případně binární data překódovaná do base64. Reprezentace bude vytvářena parserem implementovaným v programovacím jazyce Java. První kapitola popisuje příklad, jak mohou být data uvnitř archivu uložena. Je důležité si uvědomit, že po dekompresi archivu získáme převážně XML dokumenty, ve kterých je uložena převážná část informačního obsahu dokumentu a můžeme je tudíž přímo zpracovat. Ve druhé kapitole si nejprve popíšeme jednotlivá rozhraní parserů, která umožňují snadněji pracovat s XML dokumenty. Tyto informace úzce souvisí s hlavní náplní práce -- implementací parseru. Po stručném seznámení s existujícími možnostmi zpracování dokumentů si ukážeme na doprovodném příkladě jak by vypadalo řešení v aplikaci používající parser implementující konkrétní rozhraní a zdůvodníme řešení zvolené v této práci. Třetí kapitola rozebírá možnosti reprezentace ZIP archivu jako XML souboru a volbu nejvhodnější reprezentace pro tuto aplikaci. Zmíníme též možnosti řešení situací kdy dokument obsahuje odkazy na jiné dokumenty. Cílem čtvrté kapitoly je podat stručný výklad o prostředcích poskytovaných jazykem Java, které se vážou k vlastnímu řešení a popsat konkrétní řešení problému. Pátá kapitola si potom klade za cíl demonstrovat použití vytvořené aplikace.
Klíčová slova: ZIP; XSLT; SAX
Název práce: The possibility of direct ODF/OOXML format processing in XSLT
Autor(ka) práce: Sem, Štěpán
Typ práce: Bachelor thesis
Vedoucí práce: Kosek, Jiří
Oponenti práce: Nálevka, Petr
Jazyk práce: Česky
Abstrakt:
The aim of this thesis is to allow to work with XML document archives and related data directly by the help of XML tools, e.g. XSLT processors. It is particularly about ODF and OOXML format processing. The whole archive will be represented by only one XML document, which will directly include XML documents from the inside of the archive and base64 encoded binary data eventually. The representation will be created by the parser implemented in Java programming language. The first chapter describes an example of how the data can be stored inside the archive. It is necessary to realize, that after the archive decompression, we will get mainly XML documents, in which the prevailing part of the document's content is stored and that we can therefore directly process. First of all in the second chapter, we will describe various parser interfaces, which allow to work with the XML documents more easily. This information is closely related to the main scope of the thesis - parser implementation. After the brief identification with the existing possibilities of document processing, we will demonstrate the solution in the application using a concrete interface implementing parser on an accompanying example and we will give reasons for the solution chosen in this thesis. The third chapter analyses possibilities of an ZIP archive representation as an XML file and selection of the most suitable one for this application. We will also mention the possible solutions of situations, when the document contains links to another documents. The aim of the fourth chapter is to briefly construe the Java provided facilities, which relate to the solution itself, and to describe the concrete solution to the problem. The fifth chapter aims to demonstrate the usage of the created application.
Klíčová slova: ZIP; XSLT; SAX

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 23. 12. 2008
Datum podání práce: 1. 5. 2009
Datum obhajoby: 9. 6. 2009
Identifikátor v systému InSIS: https://insis.vse.cz/zp/17947/podrobnosti

Soubory ke stažení

    Poslední aktualizace: