Automation of data preprocessing using domain knowledge

Thesis title: Automatizace předzpracování dat za využití doménových znalosti
Author: Beskyba, Jan
Thesis type: Diplomová práce
Supervisor: Šimůnek, Milan
Opponents: Pejčoch, David
Thesis language: Česky
Abstract:
V této práci se snažíme navrhnout řešení, které by přispělo k automatizaci celého procesu dobývání znalostí z databází. Důležitou roli v procesu automatizace mají doménové znalosti, které je nutné zahrnout do zde navrženého programu pro přípravu dat. V úvodu této práce se zaměříme na teoretická východiska dobývání informací z databází s důrazem na doménové znalosti. Dále se zaměříme na základní principy předzpracování dat a na skriptovací jazyk LMCL, který bude využit při implementaci aplikace určené pro automatickou přípravu dat. Následně se budeme věnovat návrhu samotné aplikace. Dle návrhu budou vybrané části aplikace implementovány a následně ověřeny na datech Poslanecké sněmovny.
Keywords: Doménové znalostí; Předzpracování dat; Dobývání znalostí z databází; Automatizace předzpracování dat
Thesis title: Automation of data preprocessing using domain knowledge
Author: Beskyba, Jan
Thesis type: Diploma thesis
Supervisor: Šimůnek, Milan
Opponents: Pejčoch, David
Thesis language: Česky
Abstract:
In this work we propose a solution that would help automate the part of knowledge discovery in databases. Domain knowledge has an important role in the automation process which is necessary to include into the proposed program for data preparation. In the introduction to this work, we focus on the theoretical basis of knowledge discovery of databases with an emphasis on domain knowledge. Next, we focus on the basic principles of data pre-processing and scripting language LMCL that could be part of the design of the newly established applications for automated data preparation. Subsequently, we will deal with application design for data pre-processing, which will be verified on the data the House of Commons.
Keywords: Domain knowledge; Data Preparation; Knowledge Discovery in Databases

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 25. 7. 2014
Date of submission: 12. 12. 2014
Date of defense: 9. 6. 2015
Identifier in the InSIS system: https://insis.vse.cz/zp/48702/podrobnosti

Files for download

    Last update: