Datové transformace pro relační učení
Název práce: | Data transformations for relational learning |
---|---|
Autor(ka) práce: | Hrudková, Kateřina |
Typ práce: | Diploma thesis |
Vedoucí práce: | Kliegr, Tomáš |
Oponenti práce: | Svátek, Vojtěch |
Jazyk práce: | English |
Abstrakt: | In response to the growing need for analysis of relational and graph data, it is necessary to ensure interoperability between different machine learning methods that process this type of data. Among the most important is inductive logic programming (ILP), which is based on the representation of relational data in a form derived from the Prolog language and learning rules from the W3C RDF standard. This thesis focuses on the ILP system Popper and the RDFRules system, which implements the AMIE approach for the analysis of RDF data. At the time of writing this thesis, there were no publicly available tools that would allow conversion between these formats; that is, if the input data was in RDF format, it was not possible to easily import it into the Popper system and vice versa. This thesis, therefore, describes two new libraries programmed in Python that allow users to transform Prolog atoms to RDF triples and vice versa. The tools are designed to support n-ary predicates and both positive and negative examples in ILP representation. The converters were evaluated on four datasets, including Michalski’s trains dataset. Both libraries are publicly available on GitHub. |
Klíčová slova: | inductive logical programming,; Python; RDF rule mining; Popper; relational learning; relational data transformations; RDFRules |
Název práce: | Datové transformace pro relační učení |
---|---|
Autor(ka) práce: | Hrudková, Kateřina |
Typ práce: | Diplomová práce |
Vedoucí práce: | Kliegr, Tomáš |
Oponenti práce: | Svátek, Vojtěch |
Jazyk práce: | English |
Abstrakt: | V návaznosti na rostoucí potřebu analýzy relačních a grafových dat je nutné zajistit interoperabilitu mezi různými metodami strojového učení, které tato data zpracovávají. Mezi nejdůležitější patří induktivní logické programování (ILP) založené na reprezentaci relačních dat ve formě odvozené od jazyka Prolog a učení pravidel z W3C standardu RDF. Tato práce se zaměřuje na ILP systém Popper a systém RDFRules implementující přístup AMIE pro analýzu RDF. V době tvorby této práce neexistovaly žádné veřejně dostupné nástroje, které by umožňovaly konverze mezi těmito formáty, tedy pokud byla vstupní data ve formátu RDF, nebylo možné je snadno importovat do systému Popper a opačně. Tato diplomová práce proto popisuje dvě nové knihovny naprogramované v jazyce Python, které uživatelům umožňují transformovat atomy nadefinované v Prologu na RDF trojice a naopak. Nástroje jsou navrženy tak, aby podporovaly n-ární predikáty a pozitivní i negativní příklady v ILP reprezentaci. Konvertory byly validovány na čtyřech datových sadách, zahrnujících standardní referenčních datovou sadu Michalski trains. Obě knihovny jsou veřejně dostupné na GitHubu. |
Klíčová slova: | transformace relačních dat; relační učení; induktivní logické programování; Popper; dolování pravidel z RDF dat; RDFRules; Python |
Informace o studiu
Studijní program / obor: | Znalostní a webové technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 29. 2. 2024 |
---|---|
Datum podání práce: | 1. 12. 2024 |
Datum obhajoby: | 20. 1. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/87829/podrobnosti |