Automatizace předzpracování dat za využití doménových znalosti

Název práce: Automatizace předzpracování dat za využití doménových znalosti
Autor(ka) práce: Beskyba, Jan
Typ práce: Diplomová práce
Vedoucí práce: Šimůnek, Milan
Oponenti práce: Pejčoch, David
Jazyk práce: Česky
Abstrakt:
V této práci se snažíme navrhnout řešení, které by přispělo k automatizaci celého procesu dobývání znalostí z databází. Důležitou roli v procesu automatizace mají doménové znalosti, které je nutné zahrnout do zde navrženého programu pro přípravu dat. V úvodu této práce se zaměříme na teoretická východiska dobývání informací z databází s důrazem na doménové znalosti. Dále se zaměříme na základní principy předzpracování dat a na skriptovací jazyk LMCL, který bude využit při implementaci aplikace určené pro automatickou přípravu dat. Následně se budeme věnovat návrhu samotné aplikace. Dle návrhu budou vybrané části aplikace implementovány a následně ověřeny na datech Poslanecké sněmovny.
Klíčová slova: Doménové znalostí; Předzpracování dat; Dobývání znalostí z databází; Automatizace předzpracování dat
Název práce: Automation of data preprocessing using domain knowledge
Autor(ka) práce: Beskyba, Jan
Typ práce: Diploma thesis
Vedoucí práce: Šimůnek, Milan
Oponenti práce: Pejčoch, David
Jazyk práce: Česky
Abstrakt:
In this work we propose a solution that would help automate the part of knowledge discovery in databases. Domain knowledge has an important role in the automation process which is necessary to include into the proposed program for data preparation. In the introduction to this work, we focus on the theoretical basis of knowledge discovery of databases with an emphasis on domain knowledge. Next, we focus on the basic principles of data pre-processing and scripting language LMCL that could be part of the design of the newly established applications for automated data preparation. Subsequently, we will deal with application design for data pre-processing, which will be verified on the data the House of Commons.
Klíčová slova: Domain knowledge; Data Preparation; Knowledge Discovery in Databases

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 25. 7. 2014
Datum podání práce: 12. 12. 2014
Datum obhajoby: 9. 6. 2015
Identifikátor v systému InSIS: https://insis.vse.cz/zp/48702/podrobnosti

Soubory ke stažení

    Poslední aktualizace: