Cluster analysis of countries based on healthcare indicators

Thesis title: Shluková analýza zemí na základě indikátorů zdravotní péče
Author: Tomášková, Tereza
Thesis type: Bakalářská práce
Supervisor: Šulc, Zdeněk
Opponents: Řezanková, Hana
Thesis language: Česky
Abstract:
Tato práce se zabývá shlukováním zemí dle úrovně jejich zdravotnictví na základě systematicky vybraných proměnných, které na zdravotnictví země nahlíží z mnoha různých pohledů. Cílem je odhalit a interpretovat přirozené shluky zemí, které se úrovní zdravotnictví navzájem podobají. Teoretická část se věnuje popisu proměnných a teoretickému ukotvení transformací, které jsou nutné pro následné shlukování. Zároveň jsou přiblíženy shlukové algoritmy, se kterými je analýza prováděna, jedná se o hierarchické shlukování, metodu k-průměrů a Gaussovské modely směsí. V praktické části jsou tyto transformace a shlukování provedeny na datech představených v teoretické části práce. Výsledkem práce jsou prezentované shluky, dle kterých je patrné, že se skupiny různých úrovní zdravotnictví v datech nachází. Tyto skupiny se navíc mezi jednotlivými algoritmy podobají a je možné najít ukazatele, které jednotlivé země ve shlucích spojují. Jako nejvhodnější řešení se pak jeví hierarchické shlukování a shlukování dle Gaussovských modelů směsí, kde pro obě řešení lze najít smysluplné interpretace skupin.
Keywords: Shluková analýza; Hierarchické shlukování; Gaussovské modely směsí; Zdravotnictví; Metoda k-průměrů
Thesis title: Cluster analysis of countries based on healthcare indicators
Author: Tomášková, Tereza
Thesis type: Bachelor thesis
Supervisor: Šulc, Zdeněk
Opponents: Řezanková, Hana
Thesis language: Česky
Abstract:
This thesis examines the clustering of countries according to their level of healthcare based on systematically selected variables that view a country's health from many different perspectives. The aim is to uncover clusters of countries that are similar in their level of healthcare and to find how they are interlinked. The theoretical part is devoted to the description of the variables and the introduction of the transformations that are necessary for the subsequent clustering. At the same time, the clustering algorithms are introduced, namely hierarchical clustering, the method of k-means and Gaussian mixture models. In the practical part, these transformations and clusterings are performed on the data presented in the theoretical part of the thesis. As a result of the analysis, the presented clusters show that groups of different levels of healthcare seem to be present in the data. Moreover, these groups are similar between the algorithms and it is possible to find indicators that connect the countries in the clusters. Hierarchical clustering and Gaussian mixture models clustering seem to be the most appropriate solutions, since meaningful interpretations of the groups can be found for both solutions.
Keywords: Clustering analysis; Healthcare; K-means; Hierarchical clustering; Gaussian mixture models

Information about study

Study programme: Data Analytics
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 5. 4. 2024
Date of submission: 12. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: