Clustering objects with the MCluster-Miner procedure of the LISp-Miner system

Thesis title: Shlukování dat pomocí procedury MCluster-Miner systému LISp-Miner
Author: Pelc, Tomáš
Thesis type: Bakalářská práce
Supervisor: Šimůnek, Milan
Opponents: Šulc, Zdeněk
Thesis language: Česky
Bakalářská práce se zabývá shlukováním dat pomocí procedury MCluster-Miner systému LISp-Miner. Prvním cílem práce je shluková analýza dat pomocí zmíněné procedury a posouzení možností jejího využití na různých datových sadách. Pro dosažení tohoto cíle práce je prakticky aplikována daná procedura na šesti datových sadách. Druhým cílem práce je rozebrat možnosti implementovaných algoritmů, měr podobnosti a navrhnout doporučení pro volbu parametrů úlohy shlukování. K splnění tohoto cíle jsou dostupné algoritmy a míry podobnosti porovnány podle dosažených výsledků (kvalita rozdělení objektů do shluků, čas úlohy, počet atributů použi-tých pro shlukování). Následně jsou z těchto porovnání odvozena doporučení pro volbu parame-trů úlohy shlukování. Přínosem práce jsou tyto doporučení, porovnání dostupných algoritmů a měr podobnosti, shrnutí aktuálního stavu (ke květnu 2017) modulu MCluster-Miner a ukázání možnosti zobrazení výsledků shlukovací úlohy na interaktivní analýze geografických dat. V teo-retické části práce je popsán systém LISp-Miner, základní principy shlukování, způsoby shluková-ní a míry podobnosti, které využívá GUHA-procedura MCluster-Miner, a modul MCluster-Miner. V praktické části je aplikována procedura MCluster-Miner na šesti různých datových sadách a jsou zde shrnuty dosažené výsledky.
Keywords: MCluster-Miner; metody shlukování; míry podobnosti; LISp-Miner; shluková analýza
Thesis title: Clustering objects with the MCluster-Miner procedure of the LISp-Miner system
Author: Pelc, Tomáš
Thesis type: Bachelor thesis
Supervisor: Šimůnek, Milan
Opponents: Šulc, Zdeněk
Thesis language: Česky
This bachelor thesis deals with clustering objects with the MCluster-Miner procedure of the LISp-Miner system. The first aim of this bachelor thesis is clustering objects with the mentioned pro-cedure and analyzing its possible usage on different datasets. To achieve this goal, the procedure was applied on six different datasets. The secong aim of this thesis is to analyze and compare implemented algorithms, similarity measures and to propose recommendations for clustering parameters. To achieve this goal, the available algorithms and similarity measures are compared based on achieved results (the quality of distribution objects into clusters, the time of clustering task, the number of attributes used for clustering). Based on these comparisons, the recommen-dations for clustering parameters are proposed. The benefits of this thesis are these recommenda-tions, comparisons of available algorithms and similarity measures, summary of actual state (da-ted to May 2017) of the MCluster-Miner module and showing the possibility of displaying results of clustering task at the interactive analysis of geodata. The theoretical part comprises the description of the LISp-Miner system, basic clustering principles, clustering methods and similari-ty measures used by the GUHA-procedure MCluster-Miner, and the MCluster-Miner module. In the practical part the MCluster-Miner procedure is being applied on six different datasets and the achieved results are summarized there.
Keywords: similarity measures; MCluster-Miner; LISp-Miner; clustering methods; clustering

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 29. 10. 2016
Date of submission: 1. 5. 2017
Date of defense: 19. 6. 2017
Identifier in the InSIS system:

Files for download

    Last update: