Závislost měsíčních příjmů a vybraných vysvětlujících proměnných: ukázka regresní analýzy s důrazem na její možné různé cíle
Název práce: | Závislost měsíčních příjmů a vybraných vysvětlujících proměnných: ukázka regresní analýzy s důrazem na její možné různé cíle |
---|---|
Autor(ka) práce: | Bisová, Lenka |
Typ práce: | Diplomová práce |
Vedoucí práce: | Helman, Karel |
Oponenti práce: | Zíková, Alžběta |
Jazyk práce: | Česky |
Abstrakt: | Tato diplomová práce se zabývá regresní analýzou s důrazem na její možné cíle. Pro praktickou část této práce je vybrán dataset, na kterém je názorně ukázáno, jak se s regresní analýzou má zacházet v daném cíli. Pokud je cílem pouze popis zkoumaného souboru, neměly by se provádět žádné testy statistických hypotéz. Na druhou stranu zde nejsou žádné podmínky, které by se musely splnit, aby byla možná deskripce datového souboru, tudíž ji lze vždy provést. Aby se nalezené vztahy mohly zobecňovat na celou populaci nebo na předpokládaný data-generující proces, je potřebné splnit silnou sadu předpokladů o nesystematické složce, pokud tato sada podmínek není splněna, neměly by se testovat žádné hypotézy ani sestavovat intervaly spolehlivosti. Pro kauzální cíl musejí být splněny ještě další podmínky, které je velmi těžké splnit, pokud ale nejsou splněny, neměly by se regresní parametry interpretovat kauzálně. Predikce nevyžaduje žádné podmínky, její cíl je pouze najít nejlepší regresní funkci či algoritmus strojového učení, který bude nejlépe předpovídat vysvětlovanou proměnnou na základě nových hodnot vysvětlující proměnné. Všechny regresní analýzy jsou ukázané na proměnných měsíční příjem, věk, celkový počet odpracovaných let a vzdělání, kdy vysvětlovanou proměnnou je vždy měsíční příjem. V této práci je taktéž ukázaný rozdíl mezi párovými a dílčímy vztahy. K dosáhnutí výsledků jednotlivých regresních analýz je využívaný statistický program RStudio, pomocí kterého jsou ukázány všechny grafy a vypočítány/odhadovány regresní parametry v této práci. |
Klíčová slova: | deskripce; inference; kauzalita; predikce; regresní analýza |
Název práce: | Relationship between monthly income and chosen explanatory variables: example of regression analysis with emphasis on its possible goals |
---|---|
Autor(ka) práce: | Bisová, Lenka |
Typ práce: | Diploma thesis |
Vedoucí práce: | Helman, Karel |
Oponenti práce: | Zíková, Alžběta |
Jazyk práce: | Česky |
Abstrakt: | The diploma thesis deals with regression analysis with emphases on its possible goals. For practical part of the thesis was chosen dataset on which it was shown how regression analysis should be treated according to selected goal. If the goal of regression analysis is to describe analysed dataset, no statistical hypothesis should be run. On the other hand, no theoretical assumptions are needed to check for a dataset description, so description can be always done. To generalizing relationships between variables to the population or data-generated process, it is necessary to meet assumptions about error term. If these assumptions are not satisfied, no hypothesis testing or constructing confidence intervals should be made. For causal goal of regression analysis even more assumptions need to be satisfied, which is very hard to meet. If these assumptions are not satisfied, regression parameters should not be interpreted causally. Prediction of regression analysis do not require any assumptions, its aim is to find the best regression function or machine learning algorithm, which will best predict response variable according to new values of explanatory variables. All regression analyses in the thesis use variables as monthly income, age, total working years and education. Response variable is always monthly income. Difference between paired and partial relationships are also shown in this thesis. To achieve the goals of the regression analysis, the statistical program Rstudio is used, which enables to show all the graphs and calculate/estimate regression parameters in this thesis. |
Klíčová slova: | causality; prediction; regression analyses; description; inference |
Informace o studiu
Studijní program / obor: | Statistika |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 31. 3. 2022 |
---|---|
Datum podání práce: | 28. 4. 2023 |
Datum obhajoby: | 22. 8. 2023 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/80426/podrobnosti |