Porovnání algoritmů shlukové analýzy při segmentaci v marketingových výzkumech
Autor(ka) práce:
Pravda, Petr
Typ práce:
Diplomová práce
Vedoucí práce:
Šulc, Zdeněk
Oponenti práce:
Cibulková, Jana
Jazyk práce:
Česky
Abstrakt:
Tato diplomová práce se zabývá využitím shlukové analýzy pro segmentaci v marketingových výzkumech. Cílem práce je zjistit, které metody vedou k nejlepším výsledkům při shlukování objektů na základě typických marketingových proměnných. Vstupní data jsou ordinální škály využívané v marketingových výzkumech. Analyzována jsou pomocí metod vhodných jak pro kvantitativní proměnné (hierarchické shlukování s euklidovskou vzdáleností, metoda k-průměrů, metoda k-mediánů a Gaussovský model směsí), tak metodami vhodnými pro nominální proměnné (hierarchické shlukování s mírou podobnosti IOF, analýza latentních tříd a metoda k-modů). Použitá evaluační kritéria ukazují, že nejlepších výsledků při analýze ordinálních proměnných metodami pro kvantitativní data dosahuje metoda k-průměrů, zatímco u metod pro nominální data vychází nejlépe analýza latentních tříd. Z pohledu interpretace výsledných shluků se jako nejvhodnější jeví metoda k-průměrů, která tak představuje nejefektivnější nástroj segmentace v marketingových výzkumech mezi zkoumanými přístupy.
Klíčová slova:
shluková analýza; marketingový výzkum; hierarchické shlukování; metoda k-průměrů; metoda k-mediánů; metoda k-modů; Gaussovský model směsí; analýza latentních tříd
Název práce:
Comparison of Clustering Algorithms in Market Research Segmentation
Autor(ka) práce:
Pravda, Petr
Typ práce:
Diploma thesis
Vedoucí práce:
Šulc, Zdeněk
Oponenti práce:
Cibulková, Jana
Jazyk práce:
Česky
Abstrakt:
This thesis focuses on the use of cluster analysis for segmentation in marketing research. The goal of the thesis is to determine which methods lead to the best results when clustering objects based on typical marketing variables. The input data consists of ordinal scales used in marketing research. These are analyzed using methods suitable for both quantitative variables (hierarchical clustering with Euclidean distance, k-means, k-medians, and Gaussian Mixture Model), as well as methods suitable for nominal variables (hierarchical clustering with IOF similarity measure, Latent Class Analysis, and k-modes). Evaluation criteria used in the thesis show that the best results in analyzing ordinal variables using methods for quantitative data are achieved by the k-means method, while Latent Class Analysis yields the best results for nominal data. In terms of interpretation of the resulting clusters, the k-means method appears to be the most suitable, making it the most efficient segmentation tool in marketing research among the approaches tested.