Shlukování dat pomocí procedury MCluster-Miner systému LISp-Miner
Název práce: | Shlukování dat pomocí procedury MCluster-Miner systému LISp-Miner |
---|---|
Autor(ka) práce: | Pelc, Tomáš |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Šimůnek, Milan |
Oponenti práce: | Šulc, Zdeněk |
Jazyk práce: | Česky |
Abstrakt: | Bakalářská práce se zabývá shlukováním dat pomocí procedury MCluster-Miner systému LISp-Miner. Prvním cílem práce je shluková analýza dat pomocí zmíněné procedury a posouzení možností jejího využití na různých datových sadách. Pro dosažení tohoto cíle práce je prakticky aplikována daná procedura na šesti datových sadách. Druhým cílem práce je rozebrat možnosti implementovaných algoritmů, měr podobnosti a navrhnout doporučení pro volbu parametrů úlohy shlukování. K splnění tohoto cíle jsou dostupné algoritmy a míry podobnosti porovnány podle dosažených výsledků (kvalita rozdělení objektů do shluků, čas úlohy, počet atributů použi-tých pro shlukování). Následně jsou z těchto porovnání odvozena doporučení pro volbu parame-trů úlohy shlukování. Přínosem práce jsou tyto doporučení, porovnání dostupných algoritmů a měr podobnosti, shrnutí aktuálního stavu (ke květnu 2017) modulu MCluster-Miner a ukázání možnosti zobrazení výsledků shlukovací úlohy na interaktivní analýze geografických dat. V teo-retické části práce je popsán systém LISp-Miner, základní principy shlukování, způsoby shluková-ní a míry podobnosti, které využívá GUHA-procedura MCluster-Miner, a modul MCluster-Miner. V praktické části je aplikována procedura MCluster-Miner na šesti různých datových sadách a jsou zde shrnuty dosažené výsledky. |
Klíčová slova: | MCluster-Miner; metody shlukování; míry podobnosti; LISp-Miner; shluková analýza |
Název práce: | Clustering objects with the MCluster-Miner procedure of the LISp-Miner system |
---|---|
Autor(ka) práce: | Pelc, Tomáš |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Šimůnek, Milan |
Oponenti práce: | Šulc, Zdeněk |
Jazyk práce: | Česky |
Abstrakt: | This bachelor thesis deals with clustering objects with the MCluster-Miner procedure of the LISp-Miner system. The first aim of this bachelor thesis is clustering objects with the mentioned pro-cedure and analyzing its possible usage on different datasets. To achieve this goal, the procedure was applied on six different datasets. The secong aim of this thesis is to analyze and compare implemented algorithms, similarity measures and to propose recommendations for clustering parameters. To achieve this goal, the available algorithms and similarity measures are compared based on achieved results (the quality of distribution objects into clusters, the time of clustering task, the number of attributes used for clustering). Based on these comparisons, the recommen-dations for clustering parameters are proposed. The benefits of this thesis are these recommenda-tions, comparisons of available algorithms and similarity measures, summary of actual state (da-ted to May 2017) of the MCluster-Miner module and showing the possibility of displaying results of clustering task at the interactive analysis of geodata. The theoretical part comprises the description of the LISp-Miner system, basic clustering principles, clustering methods and similari-ty measures used by the GUHA-procedure MCluster-Miner, and the MCluster-Miner module. In the practical part the MCluster-Miner procedure is being applied on six different datasets and the achieved results are summarized there. |
Klíčová slova: | similarity measures; MCluster-Miner; LISp-Miner; clustering methods; clustering |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 29. 10. 2016 |
---|---|
Datum podání práce: | 1. 5. 2017 |
Datum obhajoby: | 19. 6. 2017 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/59469/podrobnosti |