Implementation of Classification Based on Association Algorithm in the Python Programming Language
Thesis title: | Implementace algoritmu pro klasifikaci založenou na asociačních pravidlech v jazyce Python |
---|---|
Author: | Filip, Jiří |
Thesis type: | Bakalářská práce |
Supervisor: | Kliegr, Tomáš |
Opponents: | Rauch, Jan |
Thesis language: | Česky |
Abstract: | Cílem této bakalářské práce je implementovat algoritmus CBA (Classification Based on Association) pro klasifikaci založenou na asociačních pravidlech v programovacím jazyce Python. Teoretická část práce přibližuje čtenáři definice asociačních pravidel, algoritmů pro jejich dolování a algoritmů pro klasifikaci na základě asociačních pravidel.V praktické části jsou nejprve v krátkosti představeny jednotlivé nástroje využité při vývoji, načež jsou prezentovány jednotlivé podmoduly implementované knihovny a zdokumentovány její jednotlivé funkce a třídy. Chod algoritmu je ukázán na příkladu a jednotlivé kroky jsou vizualizovány. Je provedena evaluace algoritmu vzhledem k ostatním implementacím. Dosažená implementace disponuje vyšší rychlostí než některé již existující implementace v programovacím jazyce R. Implementovaný algoritmus je zvláště efektivní při zvyšování počtu vstupních klasifikačních pravidel. Výsledný balíček je možné rozšířit dalšími algoritmy pro klasifikaci založenou na asociačních pravidlech. |
Keywords: | pyARC; asociační pravidla; data mining; CBA |
Thesis title: | Implementation of Classification Based on Association Algorithm in the Python Programming Language |
---|---|
Author: | Filip, Jiří |
Thesis type: | Bachelor thesis |
Supervisor: | Kliegr, Tomáš |
Opponents: | Rauch, Jan |
Thesis language: | Česky |
Abstract: | The aim of this bachelor thesis is to implement the CBA (Classification Based on Association) algorithm in the Python programming language. Theoretical part of this thesis first introduces the reader to the definitions of association rules, mining algorithms and algorithms for classification based on association rules. In the practical part the individual tools used in the development are briefly presented. In the next section, individual sub-modules of the implemented library are documented. Example of the algorithm run is shown, and its steps are visualized. Algorithm evaluation is performed and compared to other implementations. The implemented algorithm is particularly effective for an increasing number of input class association rules. The resulting package can be extended by other algorithms for classification based on association rules. |
Keywords: | CBA; pyARC; association rules; data mining |
Information about study
Study programme: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 31. 7. 2017 |
---|---|
Date of submission: | 26. 4. 2018 |
Date of defense: | 15. 6. 2018 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/62674/podrobnosti |