Hodnocení úspěšnosti metod a koeficientů využívaných ve shlukové analýze
Název práce: | Hodnocení úspěšnosti metod a koeficientů využívaných ve shlukové analýze |
---|---|
Autor(ka) práce: | Hammerbauer, Jiří |
Typ práce: | Diplomová práce |
Vedoucí práce: | Löster, Tomáš |
Oponenti práce: | Makhalova, Elena |
Jazyk práce: | Česky |
Abstrakt: | Diplomová práce se zabývá hodnocením úspěšnosti vybraných indexů pro určení počtu shluků využívaných ve shlukové analýze. Cílem práce je na základě různých kombinací metod shlukování a vzdáleností ověřit, zda a případně při použití jakých metod a vzdáleností je možné se na výsledky indexů pro určení počtu shluků spolehnout. Výsledky úspěšnosti prezentované ve třetí kapitole naznačují, že ne všechny indexy pro určení počtu shluků lze použít univerzálně. Za nejúspěšnější index lze označit Dunnův, který dokázal správný počet shluků určit ve 37 % případů, respektive Daviesův-Bouldinův při toleranci odchylky jednoho shluku s podílem 70 %. Úspěšnost indexů je ovlivněna jak použitou metodou shlukování, tak i zvolenou vzdáleností. |
Klíčová slova: | optimální počet shluků; indexy pro určení počtu shluků; shluková analýza; hodnocení výsledků shlukování |
Název práce: | Evaluation of the Success of Coefficients and Methods Used in Cluster Analysis |
---|---|
Autor(ka) práce: | Hammerbauer, Jiří |
Typ práce: | Diploma thesis |
Vedoucí práce: | Löster, Tomáš |
Oponenti práce: | Makhalova, Elena |
Jazyk práce: | Česky |
Abstrakt: | The diploma thesis explores with the evaluation of the success of selected indices for determining the number of clusters used in cluster analysis. The aim of this thesis is on the basis of various combinations of clustering methods and distances verify whether, alternatively using which clustering methods and distances is it possible to rely on the results of indices for determining the number of clusters. The results of success rate presented in the third chapter suggest that not all of indices for determining the number of clusters can be used universally. The most successful index is Dunn index, which was able to determine the correct number of clusters in 37 % of cases, respectively Davies-Bouldin index with the share of 70 % when including deviation of one cluster. The success rate is affected by both used method and selected distance. |
Klíčová slova: | indices for determining the number of clusters; optimal number of clusters; cluster analysis; evaluation of clustering |
Informace o studiu
Studijní program / obor: | Kvantitativní metody v ekonomice/Statisticko-pojistné inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 30. 6. 2014 |
---|---|
Datum podání práce: | 8. 5. 2015 |
Datum obhajoby: | 9. 6. 2015 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/48528/podrobnosti |