Application of Cluster Analysis on Data of a Manufacturing Company

Thesis title: Aplikácia zhlukovej analýzy na dáta výrobného podniku
Author: Černá, Petronela
Thesis type: Diploma thesis
Supervisor: Řezanková, Hana
Opponents: Cibulková, Jana
Thesis language: Slovensky
Abstract:
Táto diplomová práca sa zameriava na aplikáciu rôznych metód zhlukovej analýzy na obchodné dáta českej výrobnej firmy. Hlavným cieľom je identifikácia zákazníckych segmentov a získanie informácií o preferenciách a správaní zákazníkov, čo môže viesť k efektívnejšiemu riadeniu vzťahov so zákazníkmi. Teoretická časť práce zhŕňa prehľad poznatkov o dôležitých krokoch predspracovania dátového súboru, o hierarchických a nehierarchických metódach zhlukovania a o kritériách používaných na validáciu vzniknutých zhlukov. V praktickej časti je aplikovaných dokopy osem metód zhlukovej analýzy na reálny dátový súbor obsahujúci len kvantitavívne premenné. Na úpravu dátového súboru a aplikáciu metód zhlukovej analýzy bol použitý programu R. Boli porovnané výsledky zhlukovania na pôvodných premenných, na hlavných komponentoch a s využitím euklidovskej a manhattanskej metriky. Pre vybrané najúspšnejšie metódy sú výsledky zhlukovania interpretované s dôrazom na ich využitie pre segmentáciu zákazníkov. Prínosom práce pre výrobnú firmu je identifikácia a bližší popis zákazníckych segmentov, čo pomôže firme zlepšiť povedomie o vzorcoch zákazníckého správania.
Keywords: zhluková analýza; segmentácia zákazníkov; analýza hlavných komponentov; euklidovská metrika; manhattanská metrika
Thesis title: Aplikácia zhlukovej analýzy na dáta výrobného podniku
Author: Černá, Petronela
Thesis type: Diplomová práce
Supervisor: Řezanková, Hana
Opponents: Cibulková, Jana
Thesis language: Slovensky
Abstract:
Tato diplomová práce se zaměřuje na aplikaci různých metod shlukové analýzy na obchodní data české výrobní firmy. Hlavním cílem je identifikace zákaznických segmentů a získání informací o preferencích a chování zákazníků, což může vést k efektivnějšímu řízení vztahů se zákazníky. Teoretická část práce shrnuje přehled poznatků o důležitých krocích předzpracování datového souboru, o hierarchických a nehierarchických metodách shlukování a o kritériích používaných pro validaci vzniklých shluků. V praktické části je aplikováno dohromady osm metod shlukové analýzy na reálný datový soubor obsahující jen kvantitativní proměnné. Pro úpravu datového souboru a aplikaci metod shlukové analýzy byl použit program R. Byly porovnány výsledky shlukování na původních proměnných, na hlavních komponentách a s využitím euklidovské a manhattanské metriky. Pro vybrané nejúspěšnější metody jsou výsledky shlukování interpretovány s důrazem na jejich využití pro segmentaci zákazníků. Přínosem práce pro výrobní firmu je identifikace a bližší popis zákaznických segmentů, což pomůže firmě zlepšit povědomí o vzorcích zákaznického chování.
Keywords: shluková analýza; segmentace zákazníků; analýza hlavních komponent; euklidovská metrika; manhattanská metrika
Thesis title: Application of Cluster Analysis on Data of a Manufacturing Company
Author: Černá, Petronela
Thesis type: Diploma thesis
Supervisor: Řezanková, Hana
Opponents: Cibulková, Jana
Thesis language: Slovensky
Abstract:
This master’s thesis focuses on the application of various methods of cluster analysis to the sales data of a Czech manufacturing company. The main objective is to identify customer segments and gain insights into customer preferences and behavior, which can lead to more effective customer relationship management. The theoretical part provides an overview of important steps in data preprocessing, hierarchical and non-hierarchical clustering methods, and criteria used for validating the resulting clusters. In the practical section, a total of eight clustering analysis methods are applied to a real dataset consisting of quantitative variables. The data preprocessing and cluster analysis methods were implemented using the R programming language. The results of clustering analysis are compared based on the original variables, principal components, and using the Euclidean and Manhattan distances. The interpretation of clustering results emphasizes their utility for customer segmentation. The contribution of this work to the manufacturing company lies in the identification and detailed description of customer segments, which will help the company improve its understanding of customer behavior patterns.
Keywords: cluster analysis; customer segmentation; principal component analysis; Euclidean distance; Manhattan distance

Information about study

Study programme: Statistika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 19. 10. 2022
Date of submission: 27. 6. 2023
Date of defense: 22. 8. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/82440/podrobnosti

Files for download

Main text
Private file
Download
Private annex
Private file
Download
    Last update: