Relationship between monthly income and chosen explanatory variables: example of regression analysis with emphasis on its possible goals

Thesis title: Závislost měsíčních příjmů a vybraných vysvětlujících proměnných: ukázka regresní analýzy s důrazem na její možné různé cíle
Author: Bisová, Lenka
Thesis type: Diplomová práce
Supervisor: Helman, Karel
Opponents: Zíková, Alžběta
Thesis language: Česky
Abstract:
Tato diplomová práce se zabývá regresní analýzou s důrazem na její možné cíle. Pro praktickou část této práce je vybrán dataset, na kterém je názorně ukázáno, jak se s regresní analýzou má zacházet v daném cíli. Pokud je cílem pouze popis zkoumaného souboru, neměly by se provádět žádné testy statistických hypotéz. Na druhou stranu zde nejsou žádné podmínky, které by se musely splnit, aby byla možná deskripce datového souboru, tudíž ji lze vždy provést. Aby se nalezené vztahy mohly zobecňovat na celou populaci nebo na předpokládaný data-generující proces, je potřebné splnit silnou sadu předpokladů o nesystematické složce, pokud tato sada podmínek není splněna, neměly by se testovat žádné hypotézy ani sestavovat intervaly spolehlivosti. Pro kauzální cíl musejí být splněny ještě další podmínky, které je velmi těžké splnit, pokud ale nejsou splněny, neměly by se regresní parametry interpretovat kauzálně. Predikce nevyžaduje žádné podmínky, její cíl je pouze najít nejlepší regresní funkci či algoritmus strojového učení, který bude nejlépe předpovídat vysvětlovanou proměnnou na základě nových hodnot vysvětlující proměnné. Všechny regresní analýzy jsou ukázané na proměnných měsíční příjem, věk, celkový počet odpracovaných let a vzdělání, kdy vysvětlovanou proměnnou je vždy měsíční příjem. V této práci je taktéž ukázaný rozdíl mezi párovými a dílčímy vztahy. K dosáhnutí výsledků jednotlivých regresních analýz je využívaný statistický program RStudio, pomocí kterého jsou ukázány všechny grafy a vypočítány/odhadovány regresní parametry v této práci.
Keywords: deskripce; inference; kauzalita; predikce; regresní analýza
Thesis title: Relationship between monthly income and chosen explanatory variables: example of regression analysis with emphasis on its possible goals
Author: Bisová, Lenka
Thesis type: Diploma thesis
Supervisor: Helman, Karel
Opponents: Zíková, Alžběta
Thesis language: Česky
Abstract:
The diploma thesis deals with regression analysis with emphases on its possible goals. For practical part of the thesis was chosen dataset on which it was shown how regression analysis should be treated according to selected goal. If the goal of regression analysis is to describe analysed dataset, no statistical hypothesis should be run. On the other hand, no theoretical assumptions are needed to check for a dataset description, so description can be always done. To generalizing relationships between variables to the population or data-generated process, it is necessary to meet assumptions about error term. If these assumptions are not satisfied, no hypothesis testing or constructing confidence intervals should be made. For causal goal of regression analysis even more assumptions need to be satisfied, which is very hard to meet. If these assumptions are not satisfied, regression parameters should not be interpreted causally. Prediction of regression analysis do not require any assumptions, its aim is to find the best regression function or machine learning algorithm, which will best predict response variable according to new values of explanatory variables. All regression analyses in the thesis use variables as monthly income, age, total working years and education. Response variable is always monthly income. Difference between paired and partial relationships are also shown in this thesis. To achieve the goals of the regression analysis, the statistical program Rstudio is used, which enables to show all the graphs and calculate/estimate regression parameters in this thesis.
Keywords: causality; prediction; regression analyses; description; inference

Information about study

Study programme: Statistika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 31. 3. 2022
Date of submission: 28. 4. 2023
Date of defense: 22. 8. 2023
Identifier in the InSIS system: https://insis.vse.cz/zp/80426/podrobnosti

Files for download

    Last update: