Measures of interestingness of association rules

Thesis title: Measures of interestingness of association rules
Author: Beneš, Matěj
Thesis type: Diploma thesis
Supervisor: Máša, Petr
Opponents: Sýkora, Lukáš
Thesis language: English
Abstract:
The master thesis focuses on the topic of interestingness measures of association rules. The main goal of this thesis is to collect some widely used measures of interestingness of association rules from the literature and create a Python package that implements the most important ones to be used in Cleverminer. The thesis also includes three additional goals. The first additional goal of this thesis is to show how the user can add their own measures. The second additional goal is to apply selected measures on a publicly available dataset and compare the performance of the measures with the theoretical claims made about the measures in the literature. The last goal is to measure the performance using these custom metrics in Cleverminer. A comprehensive review of widely used interestingness measures is conducted and the most important measures are implemented in a python package called miar (available at: https://github.com/M-Benes/miar or https://pypi.org/project/miar/) which is published on PyPI and globally available to install, with complete source code available on GitHub for users to use, as well as prepared to be included in Cleverminer. The performance of the package is tested, and users can also modify the package and even add their own custom measures if the package is installed locally. A selection of measures is applied to a real dataset, and their performance is compared to theoretical claims about the measures in the literature. The results of the thesis include the miar package, a complex table with over 100 interestingness measures and over 35 sources, a performance test to prove the effectiveness of the package, and a discussion about the performance of a selection of the measures.
Keywords: miar; interestingness measures; Python package; association rules; rule evaluation
Thesis title: Míry zajímavosti asociačních pravidel
Author: Beneš, Matěj
Thesis type: Diplomová práce
Supervisor: Máša, Petr
Opponents: Sýkora, Lukáš
Thesis language: English
Abstract:
Předložená diplomová práce se zabývá tématem měr zajímavosti asociačních pravidel. Hlavním cílem práce je nasbírat některé široce používané míry zajímavosti z literatury a vytvořit balíček v Pythonu, který bude implementovat ty nejdůležitější míry pro použití v Clevermineru. Diplomová práce dále obsahuje další tři doplňující cíle. Prvním cílem je popsat, jak si může uživatel přidat své míry do balíčku. Druhým cílem je aplikovat vybrané míry na veřejně dostupném datasetu a porovnat jejich výkon oproti vlastnostem daných měr zmíněných v literatuře. Posledním cílem je změřit výkonnost vytvořených funkcí při použití s Cleverminerem. V práci je provedena rozsáhlá rešerše literatury a nejdůležitější míry jsou implementovány do balíčku nazvaného miar (dostupného na: https://github.com/M-Benes/miar nebo https://pypi.org/project/miar/), který je publikován na PyPI a globálně k dispozici k instalaci, s kompletním zdrojovým kódem publikovaném na GitHubu pro potřeby uživatele. Výkonnost balíčku je otestována, uživatelé mohou míry v balíčku upravovat, či přidávat své vlastní v případě lokální instalace balíčku. Užší výběr měr je pak aplikován na volně dostupný dataset a jejich výkon porovnán s vlastnostmi z literatury. Výsledky diplomové práce zahrnují balíček miar, komplexní tabulku s více než 100 mírami zajímavosti z více než 35 různých zdrojů, test výkonnosti pro dokázání efektivnosti balíčku a diskusi o výkonu vybraných měr.
Keywords: miar; míry zajímavosti; Python balíček; asociační pravidla; vyhodnocování pravidel

Information about study

Study programme: Znalostní a webové technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 21. 10. 2024
Date of submission: 25. 6. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: