Shluková analýza dat je jednou z klasifikačních metod vícerozměrné statistické analýzy. Jejím úkolem je především zatřídění objektů do shluků tak, aby si objekty uvnitř těchto shluků byly co nejvíce podobné. Cílem této práce je vyhodnotit úspěšnosti zařazení objektů pomocí šesti hierarchických metod shlukové analýzy. K vyjádření vzdáleností mezi objekty je využita čtvercová Euklidovská vzdálenost a Mahalanobisova vzdálenost. Vyhodnocení úspěšnosti metod probíhá díky informaci, do jakého shluku d... show full abstractShluková analýza dat je jednou z klasifikačních metod vícerozměrné statistické analýzy. Jejím úkolem je především zatřídění objektů do shluků tak, aby si objekty uvnitř těchto shluků byly co nejvíce podobné. Cílem této práce je vyhodnotit úspěšnosti zařazení objektů pomocí šesti hierarchických metod shlukové analýzy. K vyjádření vzdáleností mezi objekty je využita čtvercová Euklidovská vzdálenost a Mahalanobisova vzdálenost. Vyhodnocení úspěšnosti metod probíhá díky informaci, do jakého shluku daný objekt patří, která je již obsažena v datových souborech. Práce poukázala na Wardovu metodu jako v průměru nejúspěšnější hierarchickou metodu v roztřídění objektů do shluků, jelikož právě tato metoda byla u většiny datových souborů úspěšnější v roztřídění objektů než zbylé hierarchické metody, a to jak v případě ponechání korelovaných proměnných v datovém souboru, tak při odstranění těchto proměnných. Z výsledků práce vyplývá, že pro nejvyšší úspěšnost zařazení objektů do shluků by měl být datový soubor očištěn o korelované proměnné. Pokud očištěn nebude, dosáhnou metody lepších výsledků, jestliže budou vzdálenosti objektů měřeny Euklidovskou metrikou. |