Implementation of data preparation procedures for RapidMiner

Thesis title: Implementace procedur pro předzpracování dat v systému Rapid Miner
Author: Černý, Ján
Thesis type: Diplomová práce
Supervisor: Berka, Petr
Opponents: Kliegr, Tomáš
Thesis language: Česky
Abstract:
Dobývání znalostí z databází nabývá v poslední době s přibývajícím množstvím získávaných dat na významu, přesto však používané analytické systémy často poskytují pouze ty nejznámější procedury a algoritmy. Cílem této práce je jeden z nejpoužívanějších analytických systémů RapidMiner obohatit o některé procedury předzpracování dat vytvořením rozšíření. Aby bylo možné implementované procedury pochopit a naprogramovat, je důležité orientovat se v problematice dobývání znalostí z databází, se zaměřením zejména na fázi přípravy dat. Je také podstatné popsat analytické procedury, které budou součástí rozšíření. Práce také představuje postup vývoje rozšíření pro systém RapidMiner, včetně pojednání o použitých softwarových nástrojích. Nakonec práce přestavuje vytvořené rozšíření, jehož funkčnost ověřuje na testovacích příkladech.
Keywords: rozšíření; předzpracování dat; plugin; dobývání znalostí z databází; RapidMiner
Thesis title: Implementation of data preparation procedures for RapidMiner
Author: Černý, Ján
Thesis type: Diploma thesis
Supervisor: Berka, Petr
Opponents: Kliegr, Tomáš
Thesis language: Česky
Abstract:
Knowledge Discovery in Databases (KDD) is gaining importance with the rising amount of data being collected lately, despite this analytic software systems often provide only the basic and most used procedures and algorithms. The aim of this thesis is to extend RapidMiner, one of the most frequently used systems, with some new procedures for data preprocessing. To understand and develop the procedures, it is important to be acquainted with the KDD, with emphasis on the data preparation phase. It's also important to describe the analytical procedures themselves. To be able to develop an extention for Rapidminer, its needed to get acquainted with the process of creating the extention and the tools that are used. Finally, the resulting extension is introduced and tested.
Keywords: knowledge discovery in databases; data preparation; RapidMiner; extension; plugin

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 3. 12. 2014
Date of submission: 5. 5. 2015
Date of defense: 9. 6. 2015
Identifier in the InSIS system: https://insis.vse.cz/zp/50474/podrobnosti

Files for download

    Last update: