Analýza české Wikipedie s využitím DBpedie
Název práce: | Analýza české Wikipedie s využitím DBpedie |
---|---|
Autor(ka) práce: | Karásek, Martin |
Typ práce: | Diplomová práce |
Vedoucí práce: | Zeman, Václav |
Oponenti práce: | Svátek, Vojtěch |
Jazyk práce: | Česky |
Abstrakt: | Diplomová práce se věnuje oblasti sémantického webu a propojených dat. Pracuje s DBpedií coby projektem na extrakci strojově čitelných dat z Wikipedie. Cílem diplomové práce je rozšířit a zkvalitnit datový obsah české DBpedie a vytvořit soubor obsahující statistická data popisující její obsah. Tím bude dán přehled i o kvantitě dat v české Wikipedii. Součástí hlavního cíle diplomové práce je také tyto statistické údaje na webu české DBpedie vizualizovat. Diplomová práce obsahuje teoretickou část a část praktickou. V teoretické části se věnuje úvodu do sémantického webu a propojených dat, osvětluje důležité pojmy a zkoumá výchozí stav české DBpedie. Praktická část diplomové práce představuje postupné praktické kroky k naplnění hlavního cíle, zabývá se konkrétními úpravami české DBpedie, kvantifikuje výsledek provedených úprav, popisuje proces tvorby statistického datasetu a aplikace pro jeho automatickou aktualizaci. Je detailně popsán i proces vizualizace statistických údajů na webu české DBpedie a na několika příkladech je popsáno praktické využití vizualizovaných statistik k budoucímu zkvalitnění obsahu české Wikipedie. |
Klíčová slova: | Sémantický web; RDF; ontologie; SPARQL; Wikipedia; DBpedia |
Název práce: | Analysing Czech Wikipedia using DBpedia |
---|---|
Autor(ka) práce: | Karásek, Martin |
Typ práce: | Diploma thesis |
Vedoucí práce: | Zeman, Václav |
Oponenti práce: | Svátek, Vojtěch |
Jazyk práce: | Česky |
Abstrakt: | The diploma thesis deals with domain of semantic web and linked data. It works with DBpedia as a project to extract structured data from Wikipedia. The aim of this diploma is to extend and improve the data content of Czech DBpedia and to create a data file containing statistical data describing its content. This will give an overview of data quantity in Czech Wikipedia. Part of this aim is also to visualize these statistical data on Czech DBpedia website. The diploma thesis contains theoretical part and practical part. The theoretical part introduces the semantic web and linked data, explains important concepts and terms and examines the initial state of Czech DBpedia. The practical part presents practical steps to fulfill the main aim, deals with specfic modifications of the Czech DBpedia, quantifies the result of the modifications made, describes the process of creating a statistical dataset application for its automatic updating. The process of visualization of statistical data on Czech DBpedia website is also described in detail and there are several examples of possible utilization of visualized statistics for the future improvement of the content of Czech Wikipedia. |
Klíčová slova: | RDF; ontology; SPARQL; Wikipedia; DBpedia; Semantic web |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Znalostní a webové technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 3. 1. 2018 |
---|---|
Datum podání práce: | 3. 12. 2018 |
Datum obhajoby: | 21. 1. 2019 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/64354/podrobnosti |