Thesis title: |
Porovnání algoritmů shlukové analýzy při segmentaci v marketingových výzkumech |
Author: |
Pravda, Petr |
Thesis type: |
Diplomová práce |
Supervisor: |
Šulc, Zdeněk |
Opponents: |
Cibulková, Jana |
Thesis language: |
Česky |
Abstract: |
Tato diplomová práce se zabývá využitím shlukové analýzy pro segmentaci v marketingových výzkumech. Cílem práce je zjistit, které metody vedou k nejlepším výsledkům při shlukování objektů na základě typických marketingových proměnných. Vstupní data jsou ordinální škály využívané v marketingových výzkumech. Analyzována jsou pomocí metod vhodných jak pro kvantitativní proměnné (hierarchické shlukování s euklidovskou vzdáleností, metoda k-průměrů, metoda k-mediánů a Gaussovský model směsí), tak metodami vhodnými pro nominální proměnné (hierarchické shlukování s mírou podobnosti IOF, analýza latentních tříd a metoda k-modů). Použitá evaluační kritéria ukazují, že nejlepších výsledků při analýze ordinálních proměnných metodami pro kvantitativní data dosahuje metoda k-průměrů, zatímco u metod pro nominální data vychází nejlépe analýza latentních tříd. Z pohledu interpretace výsledných shluků se jako nejvhodnější jeví metoda k-průměrů, která tak představuje nejefektivnější nástroj segmentace v marketingových výzkumech mezi zkoumanými přístupy. |
Keywords: |
shluková analýza; marketingový výzkum; hierarchické shlukování; metoda k-průměrů; metoda k-mediánů; metoda k-modů; Gaussovský model směsí; analýza latentních tříd |
Thesis title: |
Comparison of Clustering Algorithms in Market Research Segmentation |
Author: |
Pravda, Petr |
Thesis type: |
Diploma thesis |
Supervisor: |
Šulc, Zdeněk |
Opponents: |
Cibulková, Jana |
Thesis language: |
Česky |
Abstract: |
This thesis focuses on the use of cluster analysis for segmentation in marketing research. The goal of the thesis is to determine which methods lead to the best results when clustering objects based on typical marketing variables. The input data consists of ordinal scales used in marketing research. These are analyzed using methods suitable for both quantitative variables (hierarchical clustering with Euclidean distance, k-means, k-medians, and Gaussian Mixture Model), as well as methods suitable for nominal variables (hierarchical clustering with IOF similarity measure, Latent Class Analysis, and k-modes). Evaluation criteria used in the thesis show that the best results in analyzing ordinal variables using methods for quantitative data are achieved by the k-means method, while Latent Class Analysis yields the best results for nominal data. In terms of interpretation of the resulting clusters, the k-means method appears to be the most suitable, making it the most efficient segmentation tool in marketing research among the approaches tested. |
Keywords: |
k-medians; k-modes; Gaussian Mixture Model; cluster analysis; marketing research; hierarchical clustering; k-means; Latent Class Analysis |
Information about study
Study programme: |
Statistika |
Type of study programme: |
Magisterský studijní program |
Assigned degree: |
Ing. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Statistics and Probability |
Information on submission and defense
Date of assignment: |
30. 10. 2023 |
Date of submission: |
1. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.