Porovnání alternativních metod práce s chybějícími hodnotami v regresních modelech

Název práce: Porovnanie alternatívnych metód práce s chýbajúcimi hodnotami v regresných modeloch
Autor(ka) práce: Šicková, Barbora
Typ práce: Diplomová práce
Vedoucí práce: Zouhar, Jan
Oponenti práce: Frýd, Lukáš
Jazyk práce: Slovensky
Abstrakt:
Cieľom práce je porovnať vybrané techniky práce s chýbajúcimi hodnotami prostredníctvom Monte Carlo experimentov. Dáta generujúce procesy použité v simulačných experimentoch vychádzajú z reálneho, hojne študovaného dátového súboru. Výber techník práce s chýbajúcimi hodnotami sa zameriava na porovnanie jednoduchších konvenčných prístupov a modernejších postupov využívajúcich viacnásobnú imputáciu. Jednotlivé techniky porovnávame pomocou normovanej odmocniny strednej štvorcovej chyby, normovaného vychýlenia a pokrytia intervalov spoľahlivosti jednotlivých odhadnutých regresných koeficientov. Modely, ktorými sa zaoberáme zahŕňajú spojitú závislú premennú, interakcie, štvorce a binárne premenné. Takéto modely volíme preto, že vo väčšine výskumov sa stretávame s kategoriálnou závislou premennou a jednoduchšou štruktúrou modelu. Cieľom práce je preskúmať možnosti pri práci s dátami, ktoré obsahujú chýbajúce hodnoty a doposiaľ neboli v literatúre podrobne rozobrané.
Klíčová slova: chýbajúce hodnoty; konvenčné metódy; viacnásobná imputácia
Název práce: Porovnání alternativních metod práce s chybějícími hodnotami v regresních modelech
Autor(ka) práce: Šicková, Barbora
Typ práce: Diplomová práce
Vedoucí práce: Zouhar, Jan
Oponenti práce: Frýd, Lukáš
Jazyk práce: Slovensky
Abstrakt:
Problém, se kterým se setkáváme u předpřípravy dat jsou chybějící hodnoty. Existuje více způsobů jak se v regresní analýze vypořádat s chybějícími hodnotami. Cílem práce je porovnat vybrané techniky práce s chybějícími hodnotami prostřednictvím Monte Carlo experimentů. Data generující procesy použité v simulačních experinetech vychází z~reálného, hojně studovaného datového souboru. Výběr technik práce s chybějícími hodnotami se zaměřuje na porovnání jednodušších konvenčních technik a modernějších postupů využívajících vícenásobné imputace. Jednotlivé techniky srovnáváme pomocí střední čtvercové chyby, vychýlení a pokrytí intervalů spolehlivosti odhadnutých regresních koeficientů. Modely, kterými se zaobíráme obsahují spojitou závislou proměnnou, interakce, čtverce a binární proměnné. Tyhle modely volíme proto, že ve věčšině výskumů se střetáváme s kategoríální závislou proměnnou a jednoduchší strukturou modelu. Cílem práce je prozkoumat možnosti u dat s chybějícími hodnotami, které nebyly v literatuře podrobně rozebrány.
Klíčová slova: chybějící hodnoty; konvenční metody; vícenásobní imputace
Název práce: A comparison of different methods for handling missing data in regression models
Autor(ka) práce: Šicková, Barbora
Typ práce: Diploma thesis
Vedoucí práce: Zouhar, Jan
Oponenti práce: Frýd, Lukáš
Jazyk práce: Slovensky
Abstrakt:
This thesis aims to survey different methods for handling missing data in regression models by Monte Carlo experiments. Data generating processes used in simulation experiments are based on widely used real data set. The choice of missing data techniques aims to compare simpler conventional methods and modern multiple imputations. We compare these approaches according to normalized root mean square deviation, normalized bias and coverage probability of confidence intervals. Fitted regression models contain continuous dependent variable, squares, interactions and binary variables. We chose these models because in surveys we can mostly find categorical dependent variable and model structure is simpler. Nevertheless, the literature on missing data is greatly expanded, we can still find a gap in studies of missing data methods. The thesis aims to survey these methods and their application in regression models.
Klíčová slova: missing data; conventional methods; multiple imputations

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra ekonometrie

Informace o odevzdání a obhajobě

Datum zadání práce: 16. 11. 2017
Datum podání práce: 14. 5. 2018
Datum obhajoby: 6. 6. 2018
Identifikátor v systému InSIS: https://insis.vse.cz/zp/65880/podrobnosti

Soubory ke stažení

    Poslední aktualizace: