Simulation comparison of methods for selection of explanatory variables in regression model

Thesis title: Simulačné porovnanie metód pre výber vysvetľujúcich premenných v regresnom modeli
Author: Javorová, Alžbeta
Thesis type: Bachelor thesis
Supervisor: Zouhar, Jan
Opponents: Tomanová, Petra
Thesis language: Slovensky
Abstract:
Regresné modely obsahujú častokrát veľké množstvo nezávislých premenných, pričom časť z nich nemusí mať vôbec žiadny vplyv na závislú premennú. Pre nás je dôležité odlíšiť regresory, ktoré sú v modeli signifikantné, od tých regresorov, ktoré nám neprinášajú žiadnu novú informáciu a môžu byť z modelu vymazané. Cieľom tejto práce je porovnať štyri rozšírené metódy pre selekciu premenných na voľne dostupných dátach pomocou dvoch dáta generujúcich procesov a nami vytvorených Monte Carlo simulácií, ktoré sú používané hlavne na simulovanie situácií, ktoré sú pod vplyvmi náhodných javov. Použitý dátový súbor zobrazuje rôzne vplyvy na priemernú mesačnú mzdu. Numerické výpočty realizujeme v jazyku R s využitím štandardných balíčkov.
Keywords: informačné kritérium; dáta generujúci proces; selekcia premenných; Monte Carlo simulácia
Thesis title: Simulation comparison of methods for selection of explanatory variables in regression model
Author: Javorová, Alžbeta
Thesis type: Bachelor thesis
Supervisor: Zouhar, Jan
Opponents: Tomanová, Petra
Thesis language: Slovensky
Abstract:
When creating regression models, we usually have more independent variables to our disposal than is required to determine dependant variable. It is important for us to distinguish between regressors that appear to be significant in our model and regressors that do not bring any additional information and thus can be excluded.The aim of this thesis is to compare four different, widely used methods for feature selection using real data set with the help of two data generating processes and Monte Carlo simulations of our own design that are used mostly for simulating situations that are under the influence of random effects. The data set we are using is showing different impacts on average month wage. Numerical calculations are realized in programming language R with the use of standard packages.
Keywords: feature selection; information criterion; data generating process; Monte Carlo simulation
Thesis title: Simulační porovnání metod pro výběr vysvětlujících proměnných v regresním modelu
Author: Javorová, Alžbeta
Thesis type: Bakalářská práce
Supervisor: Zouhar, Jan
Opponents: Tomanová, Petra
Thesis language: Slovensky
Abstract:
Regresní modely obsahují častokrát velké množství nezávisle proměnných, přičemž část z nich nemusí mít vůbec žádný vliv na závisle proměnnou. Pro nás je důležité odlišit regresory, které jsou v modelu signifikantní, od těch regresorů, které nám nepřinášejí žádnou novou informaci a můžou být z modelu vymazané. Cílem této práce je porovnat čtyři rozšířené metody pro selekci proměnných na volně dostupných datech pomocí dvou data generujících procesů a námi vytvořených Monte Carlo simulací, které jsou používané hlavně na simulování situací, které jsou pod vlivy náhodných jevů. Použitý datový soubor zobrazuje různé vlivy na průměrnou měsíční mzdu. Numerické výpočty realizujeme v jazyce R s využitím standardních balíčků.
Keywords: informační kritérium; data generující proces; Monte Carlo simulace; selekce proměnných

Information about study

Study programme: Kvantitativní metody v ekonomice/Matematické metody v ekonomii
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Econometrics

Information on submission and defense

Date of assignment: 15. 10. 2019
Date of submission: 25. 6. 2020
Date of defense: 27. 8. 2020
Identifier in the InSIS system: https://insis.vse.cz/zp/71288/podrobnosti

Files for download

    Last update: