Shlukování asociačních pravidel metodou uživatelsky definovaných bariér
Název práce: | Zhlukovanie asociačných pravidiel metódou užívateľsky definovaných bariér |
---|---|
Autor(ka) práce: | Michalovčík, Jaroslav |
Typ práce: | Diplomová práce |
Vedoucí práce: | Máša, Petr |
Oponenti práce: | Rauch, Jan |
Jazyk práce: | Slovensky |
Abstrakt: | Predmetom tejto práce je spracovanie množiny asociačných pravidiel. Dolovanie asociačných pravidiel je jednou z úloh dobývania znalostí z databáz. Pri tejto úlohe môžu vznikať veľké množstvá pravidiel. Množstvo vytvorených asociačných pravidiel predstavuje výzvu z hľadiska spresnenia informácií pre praktické využitie. Do toho vstupuje kritická fáza spracovania asociačných pravidiel, v ktorej analytici a dátoví vedci získavajú z tohto množstva pravidiel zmysluplné poznatky. Spomedzi rôznych techník spracovania sa ako účinná metóda na spracovanie veľkého počtu asociačných pravidiel ukazuje zhlukovanie. Existujúce metódy zhlukovania však plne nevyhovujú potrebám prispôsobivosti, najmä pokiaľ ide o vzdialenosť pravidiel a požiadavky špecifické pre danú analytickú úlohu. Cieľom tejto práce bolo navrhnúť a implementovať novú prispôsobiteľnú metódu zhlukovania asociačných pravidiel. Výsledkom je metóda zhlukovania asociačných pravidiel pomocou užívateľsky definovaných bariér implementovaná v jazyku Python. Metóda využíva užívateľsky definované bariéry na prispôsobenie procesu zhlukovania, pričom zohľadňuje antecedent, sukcedent, podporu a spoľahlivosť pravidiel. Umožňuje upravovať vzdialenosť pravidiel, vybrať stratégiu zlučovania zhlukov a definovať počet zhlukov tak, aby vyhovovali špecifickým analytickým úlohám. Táto univerzálna metóda je použiteľná na asociačné pravidlá bez ohľadu na proces ich ťažby a ponúka efektívny prístup na spracovanie a získanie poznatkov z množstva asociačných pravidiel. |
Klíčová slova: | asociačné pravidlá; dobývanie znalostí zdatabáz; zhluková analýza; spracovanie asociačných pravidiel; zhlukovanie asociačných pravidiel; zhlukovanie |
Název práce: | Shlukování asociačních pravidel metodou uživatelsky definovaných bariér |
---|---|
Autor(ka) práce: | Michalovčík, Jaroslav |
Typ práce: | Diplomová práce |
Vedoucí práce: | Máša, Petr |
Oponenti práce: | Rauch, Jan |
Jazyk práce: | Slovensky |
Abstrakt: | Předmětem této práce je zpracování množiny asociačních pravidel. Dolování asociačních pravidel je jednou z úloh dobývaní znalostí z databází. Při této úloze lze generovat velké množiny pravidel. Množství vygenerovaných asociačních pravidel představuje výzvu z hlediska zpřesnění informací pro praktické využití. Do toho vstupuje kritická fáze zpracování asociačních pravidel, v níž analytici a datoví vědci z tohoto množství pravidel získávají smysluplné znalosti. Mezi různými technikami zpracování se jako účinná metoda pro zpracování velkého množství asociačních pravidel ukazuje shlukování. Stávající metody shlukování však plně nevyhovují potřebám přizpůsobivosti, zejména pokud jde o vzdálenosti mezi pravidly a požadavky specifické pro danou analytickou úlohu. Cílem této práce bylo navrhnout a implementovat novou přizpůsobitelnou metodu shlukování asociačních pravidel. Výsledkem je metoda shlukování asociačních pravidel pomocí uživatelsky definovaných bariér implementovaná v jazyce Python. Metoda využívá uživatelem definované bariéry k přizpůsobení procesu shlukování, přičemž bere v úvahu antecedent, sukcedent, podporu a spolehlivost pravidel. Umožňuje upravit rozestupy mezi pravidly, zvolit strategii slučování shluků a definovat počet shluků tak, aby vyhovovaly konkrétním analytickým úlohám. Tato univerzální metoda je použitelná pro asociační pravidla bez ohledu na proces jejich dobývaní a nabízí efektivní přístup ke zpracování a získávání znalostí z množství asociačních pravidel. |
Klíčová slova: | shlukování asociačních pravidel; zpracování asociačních pravidel; asociační pravidla; dobývaní znalostí z databází; shluková analýza; shlukování |
Název práce: | Clustering of association rules using the method of user-defined barriers |
---|---|
Autor(ka) práce: | Michalovčík, Jaroslav |
Typ práce: | Diploma thesis |
Vedoucí práce: | Máša, Petr |
Oponenti práce: | Rauch, Jan |
Jazyk práce: | Slovensky |
Abstrakt: | The subject of this thesis is processing of association rules. Mining association rules is one of the knowledge mining tasks. In this task, large sets of rules can be generated, which presents a challenge in terms of refining information for practical use. The critical phase of association rule processing comes into play, where analysts and data scientists extract meaningful insights from this multitude of rules. Among various processing techniques, clustering stands out as an effective method for effectively handling many association rules. However, existing clustering methods do not fully meet the needs for adaptability, especially concerning rule distances and specific requirements for analytical tasks. The aim of this thesis was to design and implement a new adaptable method for clustering association rules. The result is a clustering method for association rules using user-defined barriers, implemented in the Python programming language. The method allows for adjusting the rule distances, selecting clustering strategies, and defining the number of clusters to cater to specific analytical tasks. This versatile method is applicable to association rules regardless of how they were mined and offers an effective approach for processing and gaining insights from a multitude of association rules. |
Klíčová slova: | association rule clustering; association rules; data mining; clustering; cluster analysis; association rule processing |
Informace o studiu
Studijní program / obor: | Znalostní a webové technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 30. 9. 2022 |
---|---|
Datum podání práce: | 29. 11. 2023 |
Datum obhajoby: | 22. 1. 2024 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/82100/podrobnosti |