Řešení problému chybějících pozorování v zobecněném lineárním modelu

Název práce: Řešení problému chybějících pozorování v zobecněném lineárním modelu
Autor(ka) práce: Beranová, Alžběta
Typ práce: Bakalářská práce
Vedoucí práce: Malá, Ivana
Oponenti práce: Procházka, Jiří
Jazyk práce: Česky
Abstrakt:
Bakalářská práce se zabývá problémem chybějících pozorování a možností jejich imputace v případě použití zobecněného lineární modelu. V teoretické části práce jsou popsány jednotlivé metody, které byly vytvořeny k řešení daného problému chybějících pozorování, a dále je zde obecně popsána logistická regrese, tedy zobecněný lineární model s binomickým rozdělením a logitovou spojovací funkcí. Empirická část je zaměřena na porovnání modelu vypočteného z dat bez chybějících pozorování s modely vypočtenými z dat s chybějícími daty nahrazenými dle jednotlivých imputačních metod. Modely jsou odhadovány v programovacím jazyce R. K modelování je použito veřejně dostupných reálných dat marketingové kampaně portugalské bankovní instituce.
Klíčová slova: AUC; GLM; chybějící hodnoty; imputace; logistická regrese; matice záměn; ROC křivka
Název práce: Solving the problem of missing observations in a generalized linear model
Autor(ka) práce: Beranová, Alžběta
Typ práce: Bachelor thesis
Vedoucí práce: Malá, Ivana
Oponenti práce: Procházka, Jiří
Jazyk práce: Česky
Abstrakt:
The bachelor thesis deals with the problem of missing observations and the possibility of their imputation in case of using a generalized linear model. In the theoretical part of the thesis, there are described the individual methods that were created to solve the given problem of missing observations, and there is generally described logistic regression, i.e. a generalized linear model with a binomial distribution and logit link function. The empirical part is focused on comparing the model calculated from data without missing observations with models calculated from data with missing data replaced by individual imputation methods. Models are calculated in R programming language. Publicly available data from real marketing campaign of the Portuguese banking institution has been used in models.
Klíčová slova: AUC; confusion matrix; GLM; imputation; logistic regression; missing values; ROC curve

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Statistika a ekonometrie
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 10. 12. 2018
Datum podání práce: 27. 6. 2019
Datum obhajoby: 22. 8. 2019
Identifikátor v systému InSIS: https://insis.vse.cz/zp/68010/podrobnosti

Soubory ke stažení

    Poslední aktualizace: