Automation of data preprocessing using domain knowledge
Thesis title: | Automatizace předzpracování dat za využití doménových znalosti |
---|---|
Author: | Beskyba, Jan |
Thesis type: | Diplomová práce |
Supervisor: | Šimůnek, Milan |
Opponents: | Pejčoch, David |
Thesis language: | Česky |
Abstract: | V této práci se snažíme navrhnout řešení, které by přispělo k automatizaci celého procesu dobývání znalostí z databází. Důležitou roli v procesu automatizace mají doménové znalosti, které je nutné zahrnout do zde navrženého programu pro přípravu dat. V úvodu této práce se zaměříme na teoretická východiska dobývání informací z databází s důrazem na doménové znalosti. Dále se zaměříme na základní principy předzpracování dat a na skriptovací jazyk LMCL, který bude využit při implementaci aplikace určené pro automatickou přípravu dat. Následně se budeme věnovat návrhu samotné aplikace. Dle návrhu budou vybrané části aplikace implementovány a následně ověřeny na datech Poslanecké sněmovny. |
Keywords: | Doménové znalostí; Předzpracování dat; Dobývání znalostí z databází; Automatizace předzpracování dat |
Thesis title: | Automation of data preprocessing using domain knowledge |
---|---|
Author: | Beskyba, Jan |
Thesis type: | Diploma thesis |
Supervisor: | Šimůnek, Milan |
Opponents: | Pejčoch, David |
Thesis language: | Česky |
Abstract: | In this work we propose a solution that would help automate the part of knowledge discovery in databases. Domain knowledge has an important role in the automation process which is necessary to include into the proposed program for data preparation. In the introduction to this work, we focus on the theoretical basis of knowledge discovery of databases with an emphasis on domain knowledge. Next, we focus on the basic principles of data pre-processing and scripting language LMCL that could be part of the design of the newly established applications for automated data preparation. Subsequently, we will deal with application design for data pre-processing, which will be verified on the data the House of Commons. |
Keywords: | Domain knowledge; Data Preparation; Knowledge Discovery in Databases |
Information about study
Study programme: | Aplikovaná informatika/Znalostní technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 25. 7. 2014 |
---|---|
Date of submission: | 12. 12. 2014 |
Date of defense: | 9. 6. 2015 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/48702/podrobnosti |