Clustering of association rules using the method of user-defined barriers

Thesis title: Zhlukovanie asociačných pravidiel metódou užívateľsky definovaných bariér
Author: Michalovčík, Jaroslav
Thesis type: Diploma thesis
Supervisor: Máša, Petr
Opponents: Rauch, Jan
Thesis language: Slovensky
Abstract:
Predmetom tejto práce je spracovanie množiny asociačných pravidiel. Dolovanie asociačných pravidiel je jednou z úloh dobývania znalostí z databáz. Pri tejto úlohe môžu vznikať veľké množstvá pravidiel. Množstvo vytvorených asociačných pravidiel predstavuje výzvu z hľadiska spresnenia informácií pre praktické využitie. Do toho vstupuje kritická fáza spracovania asociačných pravidiel, v ktorej analytici a dátoví vedci získavajú z tohto množstva pravidiel zmysluplné poznatky. Spomedzi rôznych techník spracovania sa ako účinná metóda na spracovanie veľkého počtu asociačných pravidiel ukazuje zhlukovanie. Existujúce metódy zhlukovania však plne nevyhovujú potrebám prispôsobivosti, najmä pokiaľ ide o vzdialenosť pravidiel a požiadavky špecifické pre danú analytickú úlohu. Cieľom tejto práce bolo navrhnúť a implementovať novú prispôsobiteľnú metódu zhlukovania asociačných pravidiel. Výsledkom je metóda zhlukovania asociačných pravidiel pomocou užívateľsky definovaných bariér implementovaná v jazyku Python. Metóda využíva užívateľsky definované bariéry na prispôsobenie procesu zhlukovania, pričom zohľadňuje antecedent, sukcedent, podporu a spoľahlivosť pravidiel. Umožňuje upravovať vzdialenosť pravidiel, vybrať stratégiu zlučovania zhlukov a definovať počet zhlukov tak, aby vyhovovali špecifickým analytickým úlohám. Táto univerzálna metóda je použiteľná na asociačné pravidlá bez ohľadu na proces ich ťažby a ponúka efektívny prístup na spracovanie a získanie poznatkov z množstva asociačných pravidiel.
Keywords: asociačné pravidlá; dobývanie znalostí zdatabáz; zhluková analýza; spracovanie asociačných pravidiel; zhlukovanie asociačných pravidiel; zhlukovanie
Thesis title: Shlukování asociačních pravidel metodou uživatelsky definovaných bariér
Author: Michalovčík, Jaroslav
Thesis type: Diplomová práce
Supervisor: Máša, Petr
Opponents: Rauch, Jan
Thesis language: Slovensky
Abstract:
Předmětem této práce je zpracování množiny asociačních pravidel. Dolování asociačních pravidel je jednou z úloh dobývaní znalostí z databází. Při této úloze lze generovat velké množiny pravidel. Množství vygenerovaných asociačních pravidel představuje výzvu z hlediska zpřesnění informací pro praktické využití. Do toho vstupuje kritická fáze zpracování asociačních pravidel, v níž analytici a datoví vědci z tohoto množství pravidel získávají smysluplné znalosti. Mezi různými technikami zpracování se jako účinná metoda pro zpracování velkého množství asociačních pravidel ukazuje shlukování. Stávající metody shlukování však plně nevyhovují potřebám přizpůsobivosti, zejména pokud jde o vzdálenosti mezi pravidly a požadavky specifické pro danou analytickou úlohu. Cílem této práce bylo navrhnout a implementovat novou přizpůsobitelnou metodu shlukování asociačních pravidel. Výsledkem je metoda shlukování asociačních pravidel pomocí uživatelsky definovaných bariér implementovaná v jazyce Python. Metoda využívá uživatelem definované bariéry k přizpůsobení procesu shlukování, přičemž bere v úvahu antecedent, sukcedent, podporu a spolehlivost pravidel. Umožňuje upravit rozestupy mezi pravidly, zvolit strategii slučování shluků a definovat počet shluků tak, aby vyhovovaly konkrétním analytickým úlohám. Tato univerzální metoda je použitelná pro asociační pravidla bez ohledu na proces jejich dobývaní a nabízí efektivní přístup ke zpracování a získávání znalostí z množství asociačních pravidel.
Keywords: shlukování asociačních pravidel; zpracování asociačních pravidel; asociační pravidla; dobývaní znalostí z databází; shluková analýza; shlukování
Thesis title: Clustering of association rules using the method of user-defined barriers
Author: Michalovčík, Jaroslav
Thesis type: Diploma thesis
Supervisor: Máša, Petr
Opponents: Rauch, Jan
Thesis language: Slovensky
Abstract:
The subject of this thesis is processing of association rules. Mining association rules is one of the knowledge mining tasks. In this task, large sets of rules can be generated, which presents a challenge in terms of refining information for practical use. The critical phase of association rule processing comes into play, where analysts and data scientists extract meaningful insights from this multitude of rules. Among various processing techniques, clustering stands out as an effective method for effectively handling many association rules. However, existing clustering methods do not fully meet the needs for adaptability, especially concerning rule distances and specific requirements for analytical tasks. The aim of this thesis was to design and implement a new adaptable method for clustering association rules. The result is a clustering method for association rules using user-defined barriers, implemented in the Python programming language. The method allows for adjusting the rule distances, selecting clustering strategies, and defining the number of clusters to cater to specific analytical tasks. This versatile method is applicable to association rules regardless of how they were mined and offers an effective approach for processing and gaining insights from a multitude of association rules.
Keywords: association rule clustering; association rules; data mining; clustering; cluster analysis; association rule processing

Information about study

Study programme: Znalostní a webové technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 30. 9. 2022
Date of submission: 29. 11. 2023
Date of defense: 22. 1. 2024
Identifier in the InSIS system: https://insis.vse.cz/zp/82100/podrobnosti

Files for download

    Last update: