Komponentizace transformací linked data

Název práce: Komponentizace transformací linked data
Autor(ka) práce: Pilař, Štěpán
Typ práce: Diplomová práce
Vedoucí práce: Mynarz, Jindřich
Oponenti práce: Knap, Tomáš
Jazyk práce: Česky
Abstrakt:
Diplomová práce se zabývá problematikou transformací linked data a možností kom-ponentizace extract, transform, load procesu s důrazem na přepoužitelnost. Příklady komponent jsou demonstrovány v prostředí nástroje UnifiedViews. Po prozkoumání souvisejících oblastí výzkumu, především ETL v relačním světě a managementu kvali-ty linked data, jsou pomocí bottom-up přístupu rozebrány existující extrakce a trans-formace, v nichž jsou identifikovány příležitosti komponentizace, které jsou doplněny o další možné operace inspirované transformacemi relačních dat. Kromě uvedení potenciálních komponent jsou pro každou z nich diskutovány i možnosti a limitace využití samostatně i v kombinaci s jinými komponentami. Následuje rozbor možností implementace komponent a přehled klíčových otázek při volbě způsobu jejich reali-zace. Implementace vybraných komponent v souladu s navrženým postupem je po-psána v poslední části práce. Současně je jejich využití a omezení demonstrováno na praktických úlohách s daty z oblasti veřejných zakázek.
Klíčová slova: linked data; transformace dat; deduplikace; geokódování; UnifiedViews
Název práce: Componentization of Linked Data Transformations
Autor(ka) práce: Pilař, Štěpán
Typ práce: Diploma thesis
Vedoucí práce: Mynarz, Jindřich
Oponenti práce: Knap, Tomáš
Jazyk práce: Česky
Abstrakt:
The diploma thesis is focused on transformation of linked data and opportunities for componentization of extract, transform, load process resulting in reusability of such components. UnifiedViews serves as a framework for demonstration of implementa-tion of selected components. Initial review of related fields of study, relational data oriented ETL and linked data quality management being most prominent, is followed by bottom-up analysis of existing extractors and transformations. Identified common transformations are supplemented by operations known from transformations of relational data. Options and limits of each component candidate are discussed as well as possible cooperation with other components. The next section discusses supported ways of implementation in the selected environment and provides a list of key questions for decision making process is provided. The last part describes implementation of selected components with respect to the approach suggested in the preceding section. Practical use as well as limitations of the implemented components are demonstrated on tasks transforming public contracts datasets.
Klíčová slova: deduplication; geocoding; linked data; UnifiedViews; data transformation

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Kognitivní informatika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 16. 12. 2013
Datum podání práce: 1. 6. 2014
Datum obhajoby: 10. 6. 2014
Identifikátor v systému InSIS: https://insis.vse.cz/zp/45913/podrobnosti

Soubory ke stažení

    Poslední aktualizace: