Implementation of Genetic Algorithms in the RapidMiner Software

Thesis title: Genetické algoritmy a jejich implementace v systému RapidMiner
Author: Šimandl, Petr
Thesis type: Diplomová práce
Supervisor: Berka, Petr
Opponents: Chudán, David
Thesis language: Česky
Abstract:
Tato práce se zabývá rozšiřováním software RapidMiner o nový operátor umožňující získávat klasifikační pravidla pomocí genetického algoritmu. Konkrétní systém implementovaný za tímto účelem je GAssist (Genetic clASSIfier sySTem). Nejprve je předložen úvod do problematiky, který zběžně představuje genetické algoritmy a software RapidMiner. Dále je popsána teorie v oblasti umělé inteligence a strojového učení; zároveň je poskytnut popis klasifikace a genetických algoritmů a průniku těchto dvou oblastí. Následně je představen software RapidMiner a způsoby, kterými jej lze rozšiřovat. Jednomu z těchto přístupů, vývoji dle RapidMiner Extension Template, je věnována zvláštní pozornost. Tento přístup je poté použit k implementaci vlastního pluginu pro RapidMiner. V další kapitole, která se touto implementací zabývá, je popsána struktura vyvíjeného programu včetně důležitých tříd, postupů a ukázek kódu. Závěrečná kapitola probírá testování a validaci vytvořeného pluginu. Je zde provedeno srovnání s originální implementací systému GAssist a také vybranými klasifikačními algoritmy, které nativně poskytuje RapidMiner. Dále jsou vyhodnocena měření a diskutovány jejich výsledky, včetně odchylek mezi oběma implementacemi systémů GAssist. Výstupem této práce je plugin do software RapidMiner, který implementuje klasifikátor na genetické bázi GAssist.
Keywords: strojové učení; genetické algoritmy; strojové učení na bázi genetických algoritmů; GAssist; RapidMiner; Java
Thesis title: Implementation of Genetic Algorithms in the RapidMiner Software
Author: Šimandl, Petr
Thesis type: Diploma thesis
Supervisor: Berka, Petr
Opponents: Chudán, David
Thesis language: Česky
Abstract:
This thesis deals with extending the RapidMiner software with a new operator providing the capability to generate classification rules using a genetic algorithm. The specific system implemented in this case is GAssist (Genetic clASSIfier sySTem). First, an introduction to the topic is presented, including genetic algorithms and the RapidMiner software. Subsequently, the basic theory concerning artificial intelligence and machine learning is described. Classification and genetic algorithms are additionally included and the intersection of those two areas is explored. Following is an overview of the RapidMiner software, focusing on the possibilities of its extension via plugins. One of those approaches, RapidMiner Extension Template, is given special attention as this is the approach used later in the implementation itself. The next chapter, which deals with this implementation, details the structure of the developed plugin, including important classes, algorithms and code snippets. Finally, the implementation is compared with the original GAssist system as well as selected classification algorithms, which are natively supported by the RapidMiner software. After that, the comparisons are evaluated and the results discussed, including differences between both implementations of the GAssist system. The output of this thesis is a plugin for the RapidMiner software implementing the genetics-based classifier GAssist.
Keywords: Genetic algorithms; Genetics-based machine learning; Machine learning; GAssist; RapidMiner; Java

Information about study

Study programme: Informační systémy a technologie/Vývoj informačních systémů
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 25. 9. 2022
Date of submission: 30. 4. 2023
Date of defense: 5. 6. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/81931/podrobnosti

Files for download

    Last update: