Datové transformace pro relační učení

Název práce: Data transformations for relational learning
Autor(ka) práce: Hrudková, Kateřina
Typ práce: Diploma thesis
Vedoucí práce: Kliegr, Tomáš
Oponenti práce: Svátek, Vojtěch
Jazyk práce: English
Abstrakt:
In response to the growing need for analysis of relational and graph data, it is necessary to ensure interoperability between different machine learning methods that process this type of data. Among the most important is inductive logic programming (ILP), which is based on the representation of relational data in a form derived from the Prolog language and learning rules from the W3C RDF standard. This thesis focuses on the ILP system Popper and the RDFRules system, which implements the AMIE approach for the analysis of RDF data. At the time of writing this thesis, there were no publicly available tools that would allow conversion between these formats; that is, if the input data was in RDF format, it was not possible to easily import it into the Popper system and vice versa. This thesis, therefore, describes two new libraries programmed in Python that allow users to transform Prolog atoms to RDF triples and vice versa. The tools are designed to support n-ary predicates and both positive and negative examples in ILP representation. The converters were evaluated on four datasets, including Michalski’s trains dataset. Both libraries are publicly available on GitHub.
Klíčová slova: inductive logical programming,; Python; RDF rule mining; Popper; relational learning; relational data transformations; RDFRules
Název práce: Datové transformace pro relační učení
Autor(ka) práce: Hrudková, Kateřina
Typ práce: Diplomová práce
Vedoucí práce: Kliegr, Tomáš
Oponenti práce: Svátek, Vojtěch
Jazyk práce: English
Abstrakt:
V návaznosti na rostoucí potřebu analýzy relačních a grafových dat je nutné zajistit interoperabilitu mezi různými metodami strojového učení, které tato data zpracovávají. Mezi nejdůležitější patří induktivní logické programování (ILP) založené na reprezentaci relačních dat ve formě odvozené od jazyka Prolog a učení pravidel z W3C standardu RDF. Tato práce se zaměřuje na ILP systém Popper a systém RDFRules implementující přístup AMIE pro analýzu RDF. V době tvorby této práce neexistovaly žádné veřejně dostupné nástroje, které by umožňovaly konverze mezi těmito formáty, tedy pokud byla vstupní data ve formátu RDF, nebylo možné je snadno importovat do systému Popper a opačně. Tato diplomová práce proto popisuje dvě nové knihovny naprogramované v jazyce Python, které uživatelům umožňují transformovat atomy nadefinované v Prologu na RDF trojice a naopak. Nástroje jsou navrženy tak, aby podporovaly n-ární predikáty a pozitivní i negativní příklady v ILP reprezentaci. Konvertory byly validovány na čtyřech datových sadách, zahrnujících standardní referenčních datovou sadu Michalski trains. Obě knihovny jsou veřejně dostupné na GitHubu.
Klíčová slova: transformace relačních dat; relační učení; induktivní logické programování; Popper; dolování pravidel z RDF dat; RDFRules; Python

Informace o studiu

Studijní program / obor: Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 29. 2. 2024
Datum podání práce: 1. 12. 2024
Datum obhajoby: 20. 1. 2025
Identifikátor v systému InSIS: https://insis.vse.cz/zp/87829/podrobnosti

Soubory ke stažení

    Poslední aktualizace: