Hodnocení úspěšnosti metod využívaných ve shlukové analýze

Název práce: Hodnocení úspěšnosti metod využívaných ve shlukové analýze
Autor(ka) práce: Sirota, Sergej
Typ práce: Diplomová práce
Vedoucí práce: Löster, Tomáš
Oponenti práce: Makhalova, Elena
Jazyk práce: Česky
Abstrakt:
Cílem diplomové práce je porovnat úspěšnost jednotlivých metod shlukování a jejich schopnost správně klasifikovat objekty v datových souborech do předem známých skupin. V teoretické části jsou nejdříve popsány jednotlivé kroky potřebné pro přípravu datového souboru pro samotnou shlukovou analýzu. Další část je pak věnována samotné shlukové analýze, kde jsou popsány způsoby měření podobností jak objektů, tak i shluků. Dále jsou pak popsány jednotlivé metody shlukování využité v samotné praktické části této diplomové práce. V praktické části se již analyzuje 20 souborů, kde každý soubor obsahuje pouze kvantitativní proměnné a třídící znak, podle kterého jsou objekty klasifikovány. U každého souboru jsou spočteny pro každou shlukovou metodu úspěšnosti správného rozřazení objektů do předem známých skupin. V závěru praktické části je pak souhrnný popis výsledků shlukových metod. Hlavním přínosem této práce je zhodnocení úspěšnosti metod shlukování při klasifikaci objektů do předem známých skupin.
Klíčová slova: průzkumová analýza dat; metody shlukové analýzy; měření podobností
Název práce: Scoring methods used in cluster analysis
Autor(ka) práce: Sirota, Sergej
Typ práce: Diploma thesis
Vedoucí práce: Löster, Tomáš
Oponenti práce: Makhalova, Elena
Jazyk práce: Česky
Abstrakt:
The aim of the thesis is to compare methods of cluster analysis correctly classify objects in the dataset into groups, which are known. In the theoretical section first describes the steps needed to prepare a data file for cluster analysis. The next theoretical section is dedicated to the cluster analysis, which describes ways of measuring similarity of objects and clusters, and dedicated to description the methods of cluster analysis used in practical part of this thesis. In practical part are described and analyzed 20 files. Each file contains only quantitative variables and sort characters by which objects are sorted. In each file is calculated success rate of object segmentation into groups for each cluster method. At the end of the practical part is a summary description of the results of cluster methods. The main contribution of this thesis is to evaluate the success of cluster methods for classification objects into known groups.
Klíčová slova: exploratory data analysis; cluster methods; measures of similarity

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Statisticko-pojistné inženýrství
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 17. 6. 2014
Datum podání práce: 16. 1. 2015
Datum obhajoby: 4. 2. 2015
Identifikátor v systému InSIS: https://insis.vse.cz/zp/48263/podrobnosti

Soubory ke stažení

    Poslední aktualizace: