Utilization of XML databases for retrieval of data-mining specifications
Thesis title: | Využití XML databází pro zpřístupnění specifikací úloh dobývání znalostí z databází |
---|---|
Author: | Marek, Tomáš |
Thesis type: | Bakalářská práce |
Supervisor: | Kliegr, Tomáš |
Opponents: | Kosek, Jiří |
Thesis language: | Česky |
Abstract: | Cílem této práce je vytvořit systém dotazování ve vytvořených analytických zprávách uložených jako PMML dokumenty. Tyto PMML dokumenty jsou uloženy v nativní XML databázi, protože se jedná o strukturované dokumenty, které využívají prostředky XML. Vybraná XML databáze je k dispozici zdarma a její prostředky a možnosti vyhovují navrženému řešení. Dále byl vytvořen algoritmus pro vyhledávání v těchto dokumentech pomocí prostředků jazyka XQuery. Vzhledem k tomu, že prohledávaná data mají charakter XML dat nabízí se právě využití jazyka pro dotazování v XML datech. V rámci využití XQuery jazyka bylo třeba prozkoumat strukturu PMML dokumentů a využít různá propojení dat v těchto dokumentech pro zajištění správných výsledků vyhledávání. Výsledkem vyhledávání jsou asociační pravidla z těchto analytických zpráv uložených v PMML dokumentech, požadavkem vyhledávání jsou atributy, které se mají v pravidlech objevovat, jejich hodnoty a další omezení vyhledávání. Aby celý systém byl kompletní a mohl být plně využíván, je třeba vytvořit komunikační prostředí, pomocí kterého práce s uloženými daty probíhá. Pro tento účel jsou využity prostředky jazyka Java a architektura REST(ful) pro tvorbu aplikací. |
Keywords: | databáze; API; data mining; XML; PMML; XQuery |
Thesis title: | Utilization of XML databases for retrieval of data-mining specifications |
---|---|
Author: | Marek, Tomáš |
Thesis type: | Bachelor thesis |
Supervisor: | Kliegr, Tomáš |
Opponents: | Kosek, Jiří |
Thesis language: | Česky |
Abstract: | The aim of this work is to create a querying system in analytical reports stored as PMML documents. These PMML documents are stored in native XML database, because these documents are structured as XML documents. Selected XML database is available for free and its resources and means meet the proposed solution. Also searching algorithm is created to search these documents by means of XQuery language. Inasmuch as searched data have the character of the XML data the use of language for querying XML data suggests. In terms of the use of the XQuery language structure of PMML document was explored and data links in these documents was used to ensure proper search results. Results of the search are association rules from these analytical reports stored in PMML documents, requests of the search are attributes to be in the rules, their values and other limits of the search. So that the whole system is complete and could be fully used, it is necessary to create a communication environment through which the work with stored data is performed. For this purpose, Java and REST(ful) architecture for creating applications are used. |
Keywords: | API; XQuery; PMML; XML database; data mining |
Information about study
Study programme: | Aplikovaná informatika/Informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 9. 7. 2009 |
---|---|
Date of submission: | 11. 5. 2010 |
Date of defense: | 16. 6. 2010 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/21234/podrobnosti |