Logaritmická transformace vysvětlované proměnné je velmi používanou praktikou při odhadu lineárních regresních modelů. Často se používá například při práci se šikmě rozdělenými daty. Problematika spojená s log-lineárními modely spočívá ve faktu, že takový model sleduje hodnoty na jiné škále, než nás běžně výsledky zajímají. Pro získání predikcí na původní škále je proto po odhadu takového modelu nezbytná zpětná retransformace. Metody, které jsou běžně doporučovány v literatuře, předpokládají hom... zobrazit celý abstraktLogaritmická transformace vysvětlované proměnné je velmi používanou praktikou při odhadu lineárních regresních modelů. Často se používá například při práci se šikmě rozdělenými daty. Problematika spojená s log-lineárními modely spočívá ve faktu, že takový model sleduje hodnoty na jiné škále, než nás běžně výsledky zajímají. Pro získání predikcí na původní škále je proto po odhadu takového modelu nezbytná zpětná retransformace. Metody, které jsou běžně doporučovány v literatuře, předpokládají homoskedastickou náhodnou složku. Retransformace za přítomnosti heteroskedasticity je však důležitým tématem, jelikož s tímto problémem se běžně potýkáme v důlěžitých oblastech, jako je například zdravotnictví. Cílem práce je porovnat různé metody bodové a intervalové predikce hodnot závisle proměnné v log-lineárních modelech, přičemž důraz je kladen právě na práci s daty, která se svou povahou odchylují od ideálu náhodného vzorku z homogenní populace s homoskedastickou náhodnou složkou. Provedený experiment porovnává kvalitu predikcí získaných retransformací za použití korekčního faktoru předpokládajícího splnění předpokladů klasického lineárního modelu, smearing estimátoru, metody přizpůsobené heteroskedasticitě, kterou navrhl Baser, a modifikací této metody při různých formách heteroskedasticity a různých velikostech výběru. Dle výsledků experimentu lze říct, že celkově vzato poskytuje Baserova metoda kvalitnější predikce než ostatní testované metody, ačkoliv při složitější formě heteroskedasticity nefunguje příliš dobře při malých vzorcích. Ukazuje se také, že intervalová predikce není úplně spolehlivá, jelikož základní teorie je postavená na předpokladu homoskedasticity. I přesto jsou však výsledky zajímavé a zjišťujeme, že pro intervaly spolehlivosti střední podmíněné hodnoty y je možnost zlepšit úroveň pokrytí skutečných hodnot úpravou pomocí korekčního faktoru, ačkoliv v literatuře je volen jiný postup. |