Comparison of Clustering Algorithms in Market Research Segmentation

Thesis title: Porovnání algoritmů shlukové analýzy při segmentaci v marketingových výzkumech
Author: Pravda, Petr
Thesis type: Diplomová práce
Supervisor: Šulc, Zdeněk
Opponents: Cibulková, Jana
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá využitím shlukové analýzy pro segmentaci v marketingových výzkumech. Cílem práce je zjistit, které metody vedou k nejlepším výsledkům při shlukování objektů na základě typických marketingových proměnných. Vstupní data jsou ordinální škály využívané v marketingových výzkumech. Analyzována jsou pomocí metod vhodných jak pro kvantitativní proměnné (hierarchické shlukování s euklidovskou vzdáleností, metoda k-průměrů, metoda k-mediánů a Gaussovský model směsí), tak metodami vhodnými pro nominální proměnné (hierarchické shlukování s mírou podobnosti IOF, analýza latentních tříd a metoda k-modů). Použitá evaluační kritéria ukazují, že nejlepších výsledků při analýze ordinálních proměnných metodami pro kvantitativní data dosahuje metoda k-průměrů, zatímco u metod pro nominální data vychází nejlépe analýza latentních tříd. Z pohledu interpretace výsledných shluků se jako nejvhodnější jeví metoda k-průměrů, která tak představuje nejefektivnější nástroj segmentace v marketingových výzkumech mezi zkoumanými přístupy.
Keywords: shluková analýza; marketingový výzkum; hierarchické shlukování; metoda k-průměrů; metoda k-mediánů; metoda k-modů; Gaussovský model směsí; analýza latentních tříd
Thesis title: Comparison of Clustering Algorithms in Market Research Segmentation
Author: Pravda, Petr
Thesis type: Diploma thesis
Supervisor: Šulc, Zdeněk
Opponents: Cibulková, Jana
Thesis language: Česky
Abstract:
This thesis focuses on the use of cluster analysis for segmentation in marketing research. The goal of the thesis is to determine which methods lead to the best results when clustering objects based on typical marketing variables. The input data consists of ordinal scales used in marketing research. These are analyzed using methods suitable for both quantitative variables (hierarchical clustering with Euclidean distance, k-means, k-medians, and Gaussian Mixture Model), as well as methods suitable for nominal variables (hierarchical clustering with IOF similarity measure, Latent Class Analysis, and k-modes). Evaluation criteria used in the thesis show that the best results in analyzing ordinal variables using methods for quantitative data are achieved by the k-means method, while Latent Class Analysis yields the best results for nominal data. In terms of interpretation of the resulting clusters, the k-means method appears to be the most suitable, making it the most efficient segmentation tool in marketing research among the approaches tested.
Keywords: k-medians; k-modes; Gaussian Mixture Model; cluster analysis; marketing research; hierarchical clustering; k-means; Latent Class Analysis

Information about study

Study programme: Statistika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 30. 10. 2023
Date of submission: 1. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: