Analýza české Wikipedie s využitím DBpedie

Název práce: Analýza české Wikipedie s využitím DBpedie
Autor(ka) práce: Karásek, Martin
Typ práce: Diplomová práce
Vedoucí práce: Zeman, Václav
Oponenti práce: Svátek, Vojtěch
Jazyk práce: Česky
Abstrakt:
Diplomová práce se věnuje oblasti sémantického webu a propojených dat. Pracuje s DBpedií coby projektem na extrakci strojově čitelných dat z Wikipedie. Cílem diplomové práce je rozšířit a zkvalitnit datový obsah české DBpedie a vytvořit soubor obsahující statistická data popisující její obsah. Tím bude dán přehled i o kvantitě dat v české Wikipedii. Součástí hlavního cíle diplomové práce je také tyto statistické údaje na webu české DBpedie vizualizovat. Diplomová práce obsahuje teoretickou část a část praktickou. V teoretické části se věnuje úvodu do sémantického webu a propojených dat, osvětluje důležité pojmy a zkoumá výchozí stav české DBpedie. Praktická část diplomové práce představuje postupné praktické kroky k naplnění hlavního cíle, zabývá se konkrétními úpravami české DBpedie, kvantifikuje výsledek provedených úprav, popisuje proces tvorby statistického datasetu a aplikace pro jeho automatickou aktualizaci. Je detailně popsán i proces vizualizace statistických údajů na webu české DBpedie a na několika příkladech je popsáno praktické využití vizualizovaných statistik k budoucímu zkvalitnění obsahu české Wikipedie.
Klíčová slova: Sémantický web; RDF; ontologie; SPARQL; Wikipedia; DBpedia
Název práce: Analysing Czech Wikipedia using DBpedia
Autor(ka) práce: Karásek, Martin
Typ práce: Diploma thesis
Vedoucí práce: Zeman, Václav
Oponenti práce: Svátek, Vojtěch
Jazyk práce: Česky
Abstrakt:
The diploma thesis deals with domain of semantic web and linked data. It works with DBpedia as a project to extract structured data from Wikipedia. The aim of this diploma is to extend and improve the data content of Czech DBpedia and to create a data file containing statistical data describing its content. This will give an overview of data quantity in Czech Wikipedia. Part of this aim is also to visualize these statistical data on Czech DBpedia website. The diploma thesis contains theoretical part and practical part. The theoretical part introduces the semantic web and linked data, explains important concepts and terms and examines the initial state of Czech DBpedia. The practical part presents practical steps to fulfill the main aim, deals with specfic modifications of the Czech DBpedia, quantifies the result of the modifications made, describes the process of creating a statistical dataset application for its automatic updating. The process of visualization of statistical data on Czech DBpedia website is also described in detail and there are several examples of possible utilization of visualized statistics for the future improvement of the content of Czech Wikipedia.
Klíčová slova: RDF; ontology; SPARQL; Wikipedia; DBpedia; Semantic web

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 3. 1. 2018
Datum podání práce: 3. 12. 2018
Datum obhajoby: 21. 1. 2019
Identifikátor v systému InSIS: https://insis.vse.cz/zp/64354/podrobnosti

Soubory ke stažení

    Poslední aktualizace: