Utilization of XML databases for retrieval of data-mining specifications

Thesis title: Využití XML databází pro zpřístupnění specifikací úloh dobývání znalostí z databází
Author: Marek, Tomáš
Thesis type: Bakalářská práce
Supervisor: Kliegr, Tomáš
Opponents: Kosek, Jiří
Thesis language: Česky
Abstract:
Cílem této práce je vytvořit systém dotazování ve vytvořených analytických zprávách uložených jako PMML dokumenty. Tyto PMML dokumenty jsou uloženy v nativní XML databázi, protože se jedná o strukturované dokumenty, které využívají prostředky XML. Vybraná XML databáze je k dispozici zdarma a její prostředky a možnosti vyhovují navrženému řešení. Dále byl vytvořen algoritmus pro vyhledávání v těchto dokumentech pomocí prostředků jazyka XQuery. Vzhledem k tomu, že prohledávaná data mají charakter XML dat nabízí se právě využití jazyka pro dotazování v XML datech. V rámci využití XQuery jazyka bylo třeba prozkoumat strukturu PMML dokumentů a využít různá propojení dat v těchto dokumentech pro zajištění správných výsledků vyhledávání. Výsledkem vyhledávání jsou asociační pravidla z těchto analytických zpráv uložených v PMML dokumentech, požadavkem vyhledávání jsou atributy, které se mají v pravidlech objevovat, jejich hodnoty a další omezení vyhledávání. Aby celý systém byl kompletní a mohl být plně využíván, je třeba vytvořit komunikační prostředí, pomocí kterého práce s uloženými daty probíhá. Pro tento účel jsou využity prostředky jazyka Java a architektura REST(ful) pro tvorbu aplikací.
Keywords: databáze; API; data mining; XML; PMML; XQuery
Thesis title: Utilization of XML databases for retrieval of data-mining specifications
Author: Marek, Tomáš
Thesis type: Bachelor thesis
Supervisor: Kliegr, Tomáš
Opponents: Kosek, Jiří
Thesis language: Česky
Abstract:
The aim of this work is to create a querying system in analytical reports stored as PMML documents. These PMML documents are stored in native XML database, because these documents are structured as XML documents. Selected XML database is available for free and its resources and means meet the proposed solution. Also searching algorithm is created to search these documents by means of XQuery language. Inasmuch as searched data have the character of the XML data the use of language for querying XML data suggests. In terms of the use of the XQuery language structure of PMML document was explored and data links in these documents was used to ensure proper search results. Results of the search are association rules from these analytical reports stored in PMML documents, requests of the search are attributes to be in the rules, their values and other limits of the search. So that the whole system is complete and could be fully used, it is necessary to create a communication environment through which the work with stored data is performed. For this purpose, Java and REST(ful) architecture for creating applications are used.
Keywords: API; XQuery; PMML; XML database; data mining

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 9. 7. 2009
Date of submission: 11. 5. 2010
Date of defense: 16. 6. 2010
Identifier in the InSIS system: https://insis.vse.cz/zp/21234/podrobnosti

Files for download

    Last update: