Simulation study of lasso regression and elastic net regression in the presence of grouping effects

Thesis title: Simulační studie lasso regrese a elastic net regrese v přítomnosti skupinových efektů
Author: Chládek, Jakub
Thesis type: Bakalářská práce
Supervisor: Frýd, Lukáš
Opponents: Sokol, Ondřej
Thesis language: Česky
Abstract:
Tato bakalářská práce se věnuje popisu a analýze vlastností dvou penalizačních regresních metod, lasso regrese a elastic net regrese. Tyto metody byly navrženy jako alternativa ke klasické metodě nejmenších čtverců, která má dva nedostatky spojené s predikcí dat a výběrem proměnných z modelu. Obě analyzované metody poskytují řešení pro tyto nedostatky, za což vděčí jejich schopnosti smršťovat koeficienty jednotlivých proměnných směrem k nule. Jejich rozdílný přístup k volbě proměnných, stejně jako rozdílná přesnost predikce, je zkoumána prostřednictvím simulační studie. Cílem práce je zjistit, která z metod poskytuje lepší výsledky v rámci těchto dvou zkoumaných aspektů. Také se zabývá identifikací konkrétních situací, ve kterých daná metoda pracuje lépe a snaží se odůvodnit čím to je způsobeno. V analýze je upřena obzvlášť velká pozornost na situace, ve kterých se pracuje se skupinami vysoce korelovaných proměnných. Naivní verze elastic net regrese, která je použita v praktické části analýzy, dokáže odhalit skupinový efekt korelovaných proměnných. Také se umí lépe vypořádat se situacemi, ve kterých je počet proměnných mnohem větší než počet pozorování. To ve výsledku pramení, v porovnání s lasso regresí, do její lepší predikční schopnosti i do větší kontroly koeficientů při výběru proměnných.
Keywords: lasso regrese; elastic net regrese; predikční schopnost; výběr proměnných; skupinový efekt
Thesis title: Simulation study of lasso regression and elastic net regression in the presence of grouping effects
Author: Chládek, Jakub
Thesis type: Bachelor thesis
Supervisor: Frýd, Lukáš
Opponents: Sokol, Ondřej
Thesis language: Česky
Abstract:
This bachelor thesis is focused on the description and analysis of the properties of two penalty regression methods, lasso regression and elastic net regression. These two methods were proposed as an alternative to the ordinary least squares method, which has two shortcomings related to data prediction and variables selection from the model. Both methods provide a solution to these shortcomings, which is due to their ability to shrink the coefficients of particular variables towards zero. Their different approach to the selection of variables, as well as their different predictive accuracy is analysed through a simulation study. The aim of this thesis is to find out which of the methods provides better results within these two aspects. It also deals with the identification of specific situations in which the method works better and tries to justify what it is caused by. The analysis pays attention to situations in which groups of highly correlated variables are used. The naive version of the elastic net regression, that is used in the analysis, proved to be able to reveal the grouping effect of correlated variables. It is also better in dealing with situations, where the number of variables is much larger than the number of observations. This results in its better prediction ability, as well as in its more reliable control of the coefficients in the selection of variables.
Keywords: lasso regression; elastic net regression; predictive ability; variables selection; grouping effect

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistika a ekonometrie
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Econometrics

Information on submission and defense

Date of assignment: 3. 2. 2021
Date of submission: 12. 12. 2021
Date of defense: 27. 1. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/76036/podrobnosti

Files for download

    Last update: