Scoring methods used in cluster analysis

Thesis title: Hodnocení úspěšnosti metod využívaných ve shlukové analýze
Author: Sirota, Sergej
Thesis type: Diplomová práce
Supervisor: Löster, Tomáš
Opponents: Makhalova, Elena
Thesis language: Česky
Abstract:
Cílem diplomové práce je porovnat úspěšnost jednotlivých metod shlukování a jejich schopnost správně klasifikovat objekty v datových souborech do předem známých skupin. V teoretické části jsou nejdříve popsány jednotlivé kroky potřebné pro přípravu datového souboru pro samotnou shlukovou analýzu. Další část je pak věnována samotné shlukové analýze, kde jsou popsány způsoby měření podobností jak objektů, tak i shluků. Dále jsou pak popsány jednotlivé metody shlukování využité v samotné praktické části této diplomové práce. V praktické části se již analyzuje 20 souborů, kde každý soubor obsahuje pouze kvantitativní proměnné a třídící znak, podle kterého jsou objekty klasifikovány. U každého souboru jsou spočteny pro každou shlukovou metodu úspěšnosti správného rozřazení objektů do předem známých skupin. V závěru praktické části je pak souhrnný popis výsledků shlukových metod. Hlavním přínosem této práce je zhodnocení úspěšnosti metod shlukování při klasifikaci objektů do předem známých skupin.
Keywords: průzkumová analýza dat; metody shlukové analýzy; měření podobností
Thesis title: Scoring methods used in cluster analysis
Author: Sirota, Sergej
Thesis type: Diploma thesis
Supervisor: Löster, Tomáš
Opponents: Makhalova, Elena
Thesis language: Česky
Abstract:
The aim of the thesis is to compare methods of cluster analysis correctly classify objects in the dataset into groups, which are known. In the theoretical section first describes the steps needed to prepare a data file for cluster analysis. The next theoretical section is dedicated to the cluster analysis, which describes ways of measuring similarity of objects and clusters, and dedicated to description the methods of cluster analysis used in practical part of this thesis. In practical part are described and analyzed 20 files. Each file contains only quantitative variables and sort characters by which objects are sorted. In each file is calculated success rate of object segmentation into groups for each cluster method. At the end of the practical part is a summary description of the results of cluster methods. The main contribution of this thesis is to evaluate the success of cluster methods for classification objects into known groups.
Keywords: exploratory data analysis; cluster methods; measures of similarity

Information about study

Study programme: Kvantitativní metody v ekonomice/Statisticko-pojistné inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 17. 6. 2014
Date of submission: 16. 1. 2015
Date of defense: 4. 2. 2015
Identifier in the InSIS system: https://insis.vse.cz/zp/48263/podrobnosti

Files for download

    Last update: