Implementation of Classification Based on Association Algorithm in the Python Programming Language

Thesis title: Implementace algoritmu pro klasifikaci založenou na asociačních pravidlech v jazyce Python
Author: Filip, Jiří
Thesis type: Bakalářská práce
Supervisor: Kliegr, Tomáš
Opponents: Rauch, Jan
Thesis language: Česky
Abstract:
Cílem této bakalářské práce je implementovat algoritmus CBA (Classification Based on Association) pro klasifikaci založenou na asociačních pravidlech v programovacím jazyce Python. Teoretická část práce přibližuje čtenáři definice asociačních pravidel, algoritmů pro jejich dolování a algoritmů pro klasifikaci na základě asociačních pravidel.V praktické části jsou nejprve v krátkosti představeny jednotlivé nástroje využité při vývoji, načež jsou prezentovány jednotlivé podmoduly implementované knihovny a zdokumentovány její jednotlivé funkce a třídy. Chod algoritmu je ukázán na příkladu a jednotlivé kroky jsou vizualizovány. Je provedena evaluace algoritmu vzhledem k ostatním implementacím. Dosažená implementace disponuje vyšší rychlostí než některé již existující implementace v programovacím jazyce R. Implementovaný algoritmus je zvláště efektivní při zvyšování počtu vstupních klasifikačních pravidel. Výsledný balíček je možné rozšířit dalšími algoritmy pro klasifikaci založenou na asociačních pravidlech.
Keywords: pyARC; asociační pravidla; data mining; CBA
Thesis title: Implementation of Classification Based on Association Algorithm in the Python Programming Language
Author: Filip, Jiří
Thesis type: Bachelor thesis
Supervisor: Kliegr, Tomáš
Opponents: Rauch, Jan
Thesis language: Česky
Abstract:
The aim of this bachelor thesis is to implement the CBA (Classification Based on Association) algorithm in the Python programming language. Theoretical part of this thesis first introduces the reader to the definitions of association rules, mining algorithms and algorithms for classification based on association rules. In the practical part the individual tools used in the development are briefly presented. In the next section, individual sub-modules of the implemented library are documented. Example of the algorithm run is shown, and its steps are visualized. Algorithm evaluation is performed and compared to other implementations. The implemented algorithm is particularly effective for an increasing number of input class association rules. The resulting package can be extended by other algorithms for classification based on association rules.
Keywords: CBA; pyARC; association rules; data mining

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 31. 7. 2017
Date of submission: 26. 4. 2018
Date of defense: 15. 6. 2018
Identifier in the InSIS system: https://insis.vse.cz/zp/62674/podrobnosti

Files for download

    Last update: