Fuzzy GUHA

Thesis title: Fuzzy GUHA
Author: Ralbovský, Martin
Thesis type: Dissertation thesis
Supervisor: Rauch, Jan
Opponents: Svátek, Vojtěch; Holeňa, Martin ; Vojtáš, Peter
Thesis language: English
Abstract:
The GUHA method is one of the oldest methods of exploratory data analysis, which is regarded as part of the data mining or knowledge discovery in databases (KDD) scienti_c area. Unlike many other methods of data mining, the GUHA method has firm theoretical foundations in logic and statistics. In scope of the method, finding interesting knowledge corresponds to finding special formulas in satisfactory rich logical calculus, which is called observational calculus. The main topic of the thesis is application of the "fuzzy paradigm" to the GUHA method By the term "fuzzy paradigm" we mean approaches that use many-valued membership degrees or truth values, namely fuzzy set theory and fuzzy logic. The thesis does not aim to cover all the aspects of this application, it emphasises mainly on: - Association rules as the most prevalent type of formulas mined by the GUHA method - Usage of fuzzy data - Logical aspects of fuzzy association rules mining - Comparison of the GUHA theory to the mainstream fuzzy association rules - Implementation of the theory using the bit string approach The thesis throughoutly elaborates the theory of fuzzy association rules, both using the theoretical apparatus of fuzzy set theory and fuzzy logic. Fuzzy set theory is used mainly to compare the GUHA method to existing mainstream approaches to formalize fuzzy association rules, which were studied in detail. Fuzzy logic is used to define novel class of logical calculi called logical calculi of fuzzy association rules (LCFAR) for logical representation of fuzzy association rules. The problem of existence of deduction rules in LCFAR is dealt in depth. Suitable part of the proposed theory is implemented in the Ferda system using the bit string approach. In the approach, characteristics of examined objects are represented as strings of bits, which in the crisp case enables efficient computation. In order to maintain this feature also in the fuzzy case, a profound low level testing of data structures and algoritms for fuzzy bit strings have been carried out as a part of the thesis.
Keywords: fuzzy set theory; association rules; GUHA method; fuzzy logic
Thesis title: Fuzzy GUHA
Author: Ralbovský, Martin
Thesis type: Disertační práce
Supervisor: Rauch, Jan
Opponents: Svátek, Vojtěch; Holeňa, Martin ; Vojtáš, Peter
Thesis language: English
Abstract:
Metoda GUHA je jednou z nejstarších metod explorační analýzy dat, která je považována za součást vědního oboru dobývání znalostí z databází. Na rozdíl od jiných metod tohoto oboru, metoda GUHA staví na pevných teoretických základech logiky a statistiky. Metoda vnímá nalezení zajímavé znalosti jako nalezení určité formule v dostatečně bohatém logickém kalkulu, kterému se říká observační kalkul. Hlavním tématem dizertační práce je aplikace "fuzzy paradigmatu" na metodu GUHA. Pod pojmem "fuzzy paradigma" myslíme přístupy, které používají vícehodnotové stupně náležení, nebo pravdivostní hodnoty, jmenovitě fuzzy teorii množin a fuzzy logiku. Práce se nesnaží pokrýt všechny aspekty této aplikace, soustředí se na: - asociační pravidla, která jsou nejpoužívanější typy formulí v metodě GUHA - použití fuzzy dat - logické aspekty dobývání fuzzy asociačních pravidel - porovnání GUHA teorie s výzkumem fuzzy asociačních pravidel hlavního proudu - implementaci teorie s použitím bitových řetízků Práce zevrubně rozpracovává teorii fuzzy asociačních pravidel a používá přitom teoretický aparát fuzzy teorie množin i fuzzy logiky. Fuzzy teorie množin slouží zejména k porovnání metody GUHA s existujícími pokusy o formalizaci fuzzy asociačních pravidel založených na algoritmu apriori. Fuzzy logika je použita k definici nové třídy logických kalkulů nazvaných logické kalkuly fuzzy asociačních pravidel (LCFAR). Práce se detailně zabývá problémem existence dedukčních pravidel v LCFAR. Vhodná část navržené teorie je implementována v systému Ferda za pomoci bitových řetízků, což znamená reprezentace charakteristik zkoumaných objektů jako řetezce bitů. Tento přístup lze v crisp případě efektivně implementovat. Pro zachování jeho výhod ve fuzzy případě bylo provedeno hloubkové testování datových struktur a algoritmů pro reprezentaci fuzzy bitových řetízků.
Keywords: fuzzy teorie množin; asociační pravidla; fuzzy logika; metoda GUHA

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Doktorský studijní program
Assigned degree: Ph.D.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 27. 9. 2006
Date of submission: 30. 9. 2011
Date of defense: 19. 11. 2009
Identifier in the InSIS system: https://insis.vse.cz/zp/14956/podrobnosti

Files for download

    Last update: