Tématem této práce je data mining, který se díky možnosti ukládání obrovských objemů dat stává nedílnou součástí fungování podniků. Cílem práce je tedy provést data mining na datech letecké společnosti a jeho využití pro zlepšení spokojenosti jejích pasažérů. V první části práce jsou popsána teoretická východiska, která jsou důležitá k pochopení části praktické. Nejvíce je zastoupen popis fází dobývání znalostí z databází dle metodiky CRISP-DM a následně popis využívané analytické metody. Druhá ... show full abstractTématem této práce je data mining, který se díky možnosti ukládání obrovských objemů dat stává nedílnou součástí fungování podniků. Cílem práce je tedy provést data mining na datech letecké společnosti a jeho využití pro zlepšení spokojenosti jejích pasažérů. V první části práce jsou popsána teoretická východiska, která jsou důležitá k pochopení části praktické. Nejvíce je zastoupen popis fází dobývání znalostí z databází dle metodiky CRISP-DM a následně popis využívané analytické metody. Druhá část práce je praktická a postupuje dle popsané metodiky CRISP-DM. V této části se nachází samotný data mining ve formě asociačních pravidel, clusteringu, rozhodovacích stromů, neuronových sítí a logistické regrese. Došel jsem k závěru, že letecká společnost by měla využít znalostí spolehlivých asociačních pravidel s vysokou podporou a zaměřit se na oblasti, které jsou v nich obsažené. Dále by také měla využít rozhodovací stromy, které jsou pro daný problém nejkvalitnější ze všech klasifikačních metod. Pro klasifikační úlohy byly tvořeny 2 modely. Jeden pokrývá celý dataset a druhý pokrývá pouze atributy, které je možné znát před nástupem do letadla. První model má správnost 95,5 % a druhý model 82,3 %. Rozhodovací stromy mají nejvyšší správnost pravděpodobně díky většímu množství kategoriálních proměnných v datasetu. |