Simulační studie metod pro výběr vysvětlujících proměnných u lineárního regresního modelu
Název práce: | Simulační studie metod pro výběr vysvětlujících proměnných u lineárního regresního modelu |
---|---|
Autor(ka) práce: | Merkulova, Irina |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Štěpánek, Lubomír |
Oponenti práce: | Malá, Ivana |
Jazyk práce: | Česky |
Abstrakt: | Bakalářská práce se zabývá srovnáním metod pro výběr vysvětlujících proměnných do regresního modelu. Součástí práce je představení teoretických základů lineární regrese a metod pro výběr proměnných. Konkrétně se práce zaměřuje na postupnou regresi s využitím informačních kritérií, F-testů a PRESS statistiky pro volbu proměnných. V praktické části je navržena Monte Carlo (MC) simulace pro studium kvality metod společné s kritérii pro hodnocení. MC simulace je následně implementována v jazyce R v podobě frameworku, který umožňuje jednoduše zkoumat metody dostupné v balíčcích jazyka R. S využitím frameworku je následně zkoumána postupná regrese s obousměrnou eliminací založenou na Akaikeho informačním kritériu, Bayesovském informační kritériu a PRESS statistice, a postupná regrese se zpětnou eliminací založenou na F-testech. Simulace se v jednotlivých scénářích zaměřuje na vliv síly závislosti, velikosti výběru, počtu regresorů a stupně multikolinearity na schopnost metod správně vybrat relevantní proměnné. Z výsledků neplyne jednoznačný závěr o nadřazenosti jedné z metod, zdá se však, že Bayesovské informační kritérium dosahuje uspokojivých výsledků napříč zkoumanými scénáři. S využitím vytvořeného simulačního frameworku lze jednoduše zkoumat další scénáře, případně s minimálním úsilím přidat metody nové. |
Klíčová slova: | Výběr proměnných; Monte Carlo simulace; Lineární regrese; Akaikeho informační kritérium (AIC); Bayesovské infromační kritérium (BIC); F-test; PRESS; Postupná regrese; Dopředná eliminace; Zpětná eliminace; Obousměrná eliminace |
Název práce: | Simulation Study of Methods for Selecting Explanatory Variables in Linear Regression Models |
---|---|
Autor(ka) práce: | Merkulova, Irina |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Štěpánek, Lubomír |
Oponenti práce: | Malá, Ivana |
Jazyk práce: | Česky |
Abstrakt: | This bachelor thesis compares methods for exploratory variable selection in regression models. The first half of the thesis introduces theoretical foundation of linear regression and variable selection methods, using, in particular, information criteria, F-tests and PRESS statistics. In the second practical half, a Monte Carlo (MC) simulation for evaluating quality of methods is proposed. The Monte Carlo simulation is then implemented in R as a framework that allows to easily study and evaluate methods available in language R. Using the framework algorithms of two-way elimination with Akaike information criterion (AIC), Bayesian information criterion (BIC) and PRESS statistic, and backward elimination with R-tests is evaluated. The simulation studies performance under consideration of various characteristics of datasets including various strength of dependence, sample sizes, number of regressors and multicollinearity. The results do not show superiority of one of the methods. However, it seems that BIC performs well across scenarios. The framework can be easily extended with new scenarios and new methods for evaluation. |
Klíčová slova: | Backward elimination; Monte Carlo simulation; Linear regression; Akaike information criterion (AIC); Bayesian information criterion (BIC); F-test; PRESS; Step-wise regression; Forward elimination; Both-way elimination; Variable selection |
Informace o studiu
Studijní program / obor: | Matematické metody v ekonomii/Datové analýzy a modelování |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 4. 2. 2024 |
---|---|
Datum podání práce: | 27. 6. 2024 |
Datum obhajoby: | 19. 8. 2024 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/87347/podrobnosti |