Hodnocení úspěšnosti metod využívaných ve shlukové analýze
Název práce: | Hodnocení úspěšnosti metod využívaných ve shlukové analýze |
---|---|
Autor(ka) práce: | Sirota, Sergej |
Typ práce: | Diplomová práce |
Vedoucí práce: | Löster, Tomáš |
Oponenti práce: | Makhalova, Elena |
Jazyk práce: | Česky |
Abstrakt: | Cílem diplomové práce je porovnat úspěšnost jednotlivých metod shlukování a jejich schopnost správně klasifikovat objekty v datových souborech do předem známých skupin. V teoretické části jsou nejdříve popsány jednotlivé kroky potřebné pro přípravu datového souboru pro samotnou shlukovou analýzu. Další část je pak věnována samotné shlukové analýze, kde jsou popsány způsoby měření podobností jak objektů, tak i shluků. Dále jsou pak popsány jednotlivé metody shlukování využité v samotné praktické části této diplomové práce. V praktické části se již analyzuje 20 souborů, kde každý soubor obsahuje pouze kvantitativní proměnné a třídící znak, podle kterého jsou objekty klasifikovány. U každého souboru jsou spočteny pro každou shlukovou metodu úspěšnosti správného rozřazení objektů do předem známých skupin. V závěru praktické části je pak souhrnný popis výsledků shlukových metod. Hlavním přínosem této práce je zhodnocení úspěšnosti metod shlukování při klasifikaci objektů do předem známých skupin. |
Klíčová slova: | průzkumová analýza dat; metody shlukové analýzy; měření podobností |
Název práce: | Scoring methods used in cluster analysis |
---|---|
Autor(ka) práce: | Sirota, Sergej |
Typ práce: | Diploma thesis |
Vedoucí práce: | Löster, Tomáš |
Oponenti práce: | Makhalova, Elena |
Jazyk práce: | Česky |
Abstrakt: | The aim of the thesis is to compare methods of cluster analysis correctly classify objects in the dataset into groups, which are known. In the theoretical section first describes the steps needed to prepare a data file for cluster analysis. The next theoretical section is dedicated to the cluster analysis, which describes ways of measuring similarity of objects and clusters, and dedicated to description the methods of cluster analysis used in practical part of this thesis. In practical part are described and analyzed 20 files. Each file contains only quantitative variables and sort characters by which objects are sorted. In each file is calculated success rate of object segmentation into groups for each cluster method. At the end of the practical part is a summary description of the results of cluster methods. The main contribution of this thesis is to evaluate the success of cluster methods for classification objects into known groups. |
Klíčová slova: | exploratory data analysis; cluster methods; measures of similarity |
Informace o studiu
Studijní program / obor: | Kvantitativní metody v ekonomice/Statisticko-pojistné inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 17. 6. 2014 |
---|---|
Datum podání práce: | 16. 1. 2015 |
Datum obhajoby: | 4. 2. 2015 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/48263/podrobnosti |