Porovnání modifikací Gowerovy vzdálenosti při shlukování dat o bydlení mladých lidí

Název práce: Porovnání modifikací Gowerovy vzdálenosti při shlukování dat o bydlení mladých lidí
Autor(ka) práce: Trhoňová, Markéta
Typ práce: Diplomová práce
Vedoucí práce: Šulc, Zdeněk
Oponenti práce: Horníček, Jaroslav
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá problematikou shlukování smíšených dat s aplikací na reálný sociologický výzkum bydlení mladých dospělých v České republice. Hlavním metodologickým cílem je porovnat výkonnost tradičního Gowerova koeficientu a jeho nedávno navržených modifikací (např. xSV, xVE, xG3) spolu s dalšími alternativními mírami při použití algoritmů hierarchického aglomerativního shlukování (HAC) a nehierarchické metody PAM (Partitioning Around Medoids). Aplikačním cílem je vytvořit smysluplnou sociologickou segmentaci mladé generace na základě její objektivní bytové situace a budoucích aspirací. Analýza reálných dotazníkových dat ukázala, že mechanické spoléhání na matematické evaluační indexy (např. obrysový koeficient) je u zašuměných smíšených dat vysoce zavádějící. Zatímco tradiční přístupy (včetně metody HAC) často selhávaly vlivem extrémního efektu řetězení nebo tvořily neinterpretovatelné matematické artefakty, nově navržené pravděpodobnostní a informačně-teoretické metriky ve spojení s algoritmem PAM poskytly stabilnější řešení. Pomocí těchto přístupů byly v datech identifikovány hlavní makro-strukturální pilíře trhu s bydlením, empiricky byla potvrzena finanční zranitelnost samostatně žijících osob bez mezigenerační majetkové podpory (tzv. singles penalty) a byla odhalena úzká vazba mezi vysněným typem nemovitosti, kariérními plány a vnitřním postojem k riziku.
Klíčová slova: smíšená data; Gowerova vzdálenost; modifikace Gowerovy míry; shluková analýza; Partitioning Around Medoids; hierarchické aglomerativní shlukování; sociologie bydlení ; mladí dospělí
Název práce: Comparison of Gower Distance Modifications in Clustering Young Adults' Housing Data
Autor(ka) práce: Trhoňová, Markéta
Typ práce: Diploma thesis
Vedoucí práce: Šulc, Zdeněk
Oponenti práce: Horníček, Jaroslav
Jazyk práce: Česky
Abstrakt:
This master's thesis deals with the problem of clustering mixed-type data, applied to real sociological research on the housing of young adults in the Czech Republic. The main methodological objective is to compare the performance of the traditional Gower coefficient and its recently proposed modifications (e.g., xSV, xVE, xG3) along with other alternative measures using Hierarchical Agglomerative Clustering (HAC) and Partitioning Around Medoids (PAM) algorithms. The application objective is to create a meaningful sociological segmentation of the young generation based on their objective housing situation and future aspirations. The analysis of real survey data showed that a mechanical reliance on mathematical evaluation indices (e.g., silhouette coefficient) is highly misleading for noisy mixed data. While traditional approaches (including the HAC method) often failed due to the extreme chaining effect or created uninterpretable mathematical artifacts, the newly proposed probability-based and information-theoretic metrics combined with the PAM algorithm provided more stable solutions. Using these approaches, the main macro-structural pillars of the housing market were identified, the financial vulnerability of single individuals without intergenerational property support (the so-called singles penalty) was empirically confirmed, and a close link between the dream property type, career plans, and inner risk tolerance was revealed.
Klíčová slova: mixed-type data; modifications of Gower distance; young adults; Gower distance; sociology of housing; cluster analysis ; Partitioning Around Medoids; hierarchical agglomerative clustering

Informace o studiu

Studijní program / obor: Statistika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 28. 11. 2025
Datum podání práce: 17. 6. 2026
Datum obhajoby: 2026

Soubory ke stažení

Soubory budou k dispozici až po obhajobě práce.

    Poslední aktualizace: