Implementation of data preparation procedures for RapidMiner
Thesis title: | Implementace procedur pro předzpracování dat v systému Rapid Miner |
---|---|
Author: | Černý, Ján |
Thesis type: | Diplomová práce |
Supervisor: | Berka, Petr |
Opponents: | Kliegr, Tomáš |
Thesis language: | Česky |
Abstract: | Dobývání znalostí z databází nabývá v poslední době s přibývajícím množstvím získávaných dat na významu, přesto však používané analytické systémy často poskytují pouze ty nejznámější procedury a algoritmy. Cílem této práce je jeden z nejpoužívanějších analytických systémů RapidMiner obohatit o některé procedury předzpracování dat vytvořením rozšíření. Aby bylo možné implementované procedury pochopit a naprogramovat, je důležité orientovat se v problematice dobývání znalostí z databází, se zaměřením zejména na fázi přípravy dat. Je také podstatné popsat analytické procedury, které budou součástí rozšíření. Práce také představuje postup vývoje rozšíření pro systém RapidMiner, včetně pojednání o použitých softwarových nástrojích. Nakonec práce přestavuje vytvořené rozšíření, jehož funkčnost ověřuje na testovacích příkladech. |
Keywords: | rozšíření; předzpracování dat; plugin; dobývání znalostí z databází; RapidMiner |
Thesis title: | Implementation of data preparation procedures for RapidMiner |
---|---|
Author: | Černý, Ján |
Thesis type: | Diploma thesis |
Supervisor: | Berka, Petr |
Opponents: | Kliegr, Tomáš |
Thesis language: | Česky |
Abstract: | Knowledge Discovery in Databases (KDD) is gaining importance with the rising amount of data being collected lately, despite this analytic software systems often provide only the basic and most used procedures and algorithms. The aim of this thesis is to extend RapidMiner, one of the most frequently used systems, with some new procedures for data preprocessing. To understand and develop the procedures, it is important to be acquainted with the KDD, with emphasis on the data preparation phase. It's also important to describe the analytical procedures themselves. To be able to develop an extention for Rapidminer, its needed to get acquainted with the process of creating the extention and the tools that are used. Finally, the resulting extension is introduced and tested. |
Keywords: | knowledge discovery in databases; data preparation; RapidMiner; extension; plugin |
Information about study
Study programme: | Aplikovaná informatika/Znalostní technologie |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 3. 12. 2014 |
---|---|
Date of submission: | 5. 5. 2015 |
Date of defense: | 9. 6. 2015 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/50474/podrobnosti |