Application of Cluster Analysis on Data of a Manufacturing Company
Thesis title: | Aplikácia zhlukovej analýzy na dáta výrobného podniku |
---|---|
Author: | Černá, Petronela |
Thesis type: | Diploma thesis |
Supervisor: | Řezanková, Hana |
Opponents: | Cibulková, Jana |
Thesis language: | Slovensky |
Abstract: | Táto diplomová práca sa zameriava na aplikáciu rôznych metód zhlukovej analýzy na obchodné dáta českej výrobnej firmy. Hlavným cieľom je identifikácia zákazníckych segmentov a získanie informácií o preferenciách a správaní zákazníkov, čo môže viesť k efektívnejšiemu riadeniu vzťahov so zákazníkmi. Teoretická časť práce zhŕňa prehľad poznatkov o dôležitých krokoch predspracovania dátového súboru, o hierarchických a nehierarchických metódach zhlukovania a o kritériách používaných na validáciu vzniknutých zhlukov. V praktickej časti je aplikovaných dokopy osem metód zhlukovej analýzy na reálny dátový súbor obsahujúci len kvantitavívne premenné. Na úpravu dátového súboru a aplikáciu metód zhlukovej analýzy bol použitý programu R. Boli porovnané výsledky zhlukovania na pôvodných premenných, na hlavných komponentoch a s využitím euklidovskej a manhattanskej metriky. Pre vybrané najúspšnejšie metódy sú výsledky zhlukovania interpretované s dôrazom na ich využitie pre segmentáciu zákazníkov. Prínosom práce pre výrobnú firmu je identifikácia a bližší popis zákazníckych segmentov, čo pomôže firme zlepšiť povedomie o vzorcoch zákazníckého správania. |
Keywords: | zhluková analýza; segmentácia zákazníkov; analýza hlavných komponentov; euklidovská metrika; manhattanská metrika |
Thesis title: | Aplikácia zhlukovej analýzy na dáta výrobného podniku |
---|---|
Author: | Černá, Petronela |
Thesis type: | Diplomová práce |
Supervisor: | Řezanková, Hana |
Opponents: | Cibulková, Jana |
Thesis language: | Slovensky |
Abstract: | Tato diplomová práce se zaměřuje na aplikaci různých metod shlukové analýzy na obchodní data české výrobní firmy. Hlavním cílem je identifikace zákaznických segmentů a získání informací o preferencích a chování zákazníků, což může vést k efektivnějšímu řízení vztahů se zákazníky. Teoretická část práce shrnuje přehled poznatků o důležitých krocích předzpracování datového souboru, o hierarchických a nehierarchických metodách shlukování a o kritériích používaných pro validaci vzniklých shluků. V praktické části je aplikováno dohromady osm metod shlukové analýzy na reálný datový soubor obsahující jen kvantitativní proměnné. Pro úpravu datového souboru a aplikaci metod shlukové analýzy byl použit program R. Byly porovnány výsledky shlukování na původních proměnných, na hlavních komponentách a s využitím euklidovské a manhattanské metriky. Pro vybrané nejúspěšnější metody jsou výsledky shlukování interpretovány s důrazem na jejich využití pro segmentaci zákazníků. Přínosem práce pro výrobní firmu je identifikace a bližší popis zákaznických segmentů, což pomůže firmě zlepšit povědomí o vzorcích zákaznického chování. |
Keywords: | shluková analýza; segmentace zákazníků; analýza hlavních komponent; euklidovská metrika; manhattanská metrika |
Thesis title: | Application of Cluster Analysis on Data of a Manufacturing Company |
---|---|
Author: | Černá, Petronela |
Thesis type: | Diploma thesis |
Supervisor: | Řezanková, Hana |
Opponents: | Cibulková, Jana |
Thesis language: | Slovensky |
Abstract: | This master’s thesis focuses on the application of various methods of cluster analysis to the sales data of a Czech manufacturing company. The main objective is to identify customer segments and gain insights into customer preferences and behavior, which can lead to more effective customer relationship management. The theoretical part provides an overview of important steps in data preprocessing, hierarchical and non-hierarchical clustering methods, and criteria used for validating the resulting clusters. In the practical section, a total of eight clustering analysis methods are applied to a real dataset consisting of quantitative variables. The data preprocessing and cluster analysis methods were implemented using the R programming language. The results of clustering analysis are compared based on the original variables, principal components, and using the Euclidean and Manhattan distances. The interpretation of clustering results emphasizes their utility for customer segmentation. The contribution of this work to the manufacturing company lies in the identification and detailed description of customer segments, which will help the company improve its understanding of customer behavior patterns. |
Keywords: | cluster analysis; customer segmentation; principal component analysis; Euclidean distance; Manhattan distance |
Information about study
Study programme: | Statistika |
---|---|
Type of study programme: | Magisterský studijní program |
Assigned degree: | Ing. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Statistics and Probability |
Information on submission and defense
Date of assignment: | 19. 10. 2022 |
---|---|
Date of submission: | 27. 6. 2023 |
Date of defense: | 22. 8. 2023 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/82440/podrobnosti |
Files for download
Main text
Private file Download
Private file Download
Private annex
Private file Download
Private file Download