Data transformations for relational learning

Thesis title: Data transformations for relational learning
Author: Hrudková, Kateřina
Thesis type: Diploma thesis
Supervisor: Kliegr, Tomáš
Opponents: Svátek, Vojtěch
Thesis language: English
Abstract:
In response to the growing need for analysis of relational and graph data, it is necessary to ensure interoperability between different machine learning methods that process this type of data. Among the most important is inductive logic programming (ILP), which is based on the representation of relational data in a form derived from the Prolog language and learning rules from the W3C RDF standard. This thesis focuses on the ILP system Popper and the RDFRules system, which implements the AMIE approach for the analysis of RDF data. At the time of writing this thesis, there were no publicly available tools that would allow conversion between these formats; that is, if the input data was in RDF format, it was not possible to easily import it into the Popper system and vice versa. This thesis, therefore, describes two new libraries programmed in Python that allow users to transform Prolog atoms to RDF triples and vice versa. The tools are designed to support n-ary predicates and both positive and negative examples in ILP representation. The converters were evaluated on four datasets, including Michalski’s trains dataset. Both libraries are publicly available on GitHub.
Keywords: inductive logical programming,; Python; RDF rule mining; Popper; relational learning; relational data transformations; RDFRules
Thesis title: Datové transformace pro relační učení
Author: Hrudková, Kateřina
Thesis type: Diplomová práce
Supervisor: Kliegr, Tomáš
Opponents: Svátek, Vojtěch
Thesis language: English
Abstract:
V návaznosti na rostoucí potřebu analýzy relačních a grafových dat je nutné zajistit interoperabilitu mezi různými metodami strojového učení, které tato data zpracovávají. Mezi nejdůležitější patří induktivní logické programování (ILP) založené na reprezentaci relačních dat ve formě odvozené od jazyka Prolog a učení pravidel z W3C standardu RDF. Tato práce se zaměřuje na ILP systém Popper a systém RDFRules implementující přístup AMIE pro analýzu RDF. V době tvorby této práce neexistovaly žádné veřejně dostupné nástroje, které by umožňovaly konverze mezi těmito formáty, tedy pokud byla vstupní data ve formátu RDF, nebylo možné je snadno importovat do systému Popper a opačně. Tato diplomová práce proto popisuje dvě nové knihovny naprogramované v jazyce Python, které uživatelům umožňují transformovat atomy nadefinované v Prologu na RDF trojice a naopak. Nástroje jsou navrženy tak, aby podporovaly n-ární predikáty a pozitivní i negativní příklady v ILP reprezentaci. Konvertory byly validovány na čtyřech datových sadách, zahrnujících standardní referenčních datovou sadu Michalski trains. Obě knihovny jsou veřejně dostupné na GitHubu.
Keywords: transformace relačních dat; relační učení; induktivní logické programování; Popper; dolování pravidel z RDF dat; RDFRules; Python

Information about study

Study programme: Znalostní a webové technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 29. 2. 2024
Date of submission: 1. 12. 2024
Date of defense: 20. 1. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/87829/podrobnosti

Files for download

    Last update: