Robust Regression – Identification of Outliers

Thesis title: Robustní regrese - identifikace odlehlých pozorování
Author: Hybnerová, Štěpánka
Thesis type: Diplomová práce
Supervisor: Blatná, Dagmar
Opponents: Malec, Lukáš
Thesis language: Česky
Abstract:
Diplomová práce se zabývá robustní regresí – identifikací odlehlých pozorování. V práci jsou představeny vybrané robustní metody regresní analýzy, základní vícerozměrné metody identifikace odlehlých pozorování a robustní metody identifikace odlehlých pozorování založené na robustních regresních odhadech. Představené metody jsou aplikovány na vybrané sociální a ekonomické ukazatele za rok 2018. Data poskytují informace o 27 členských státech Evropské unie, které byly jejími členy k říjnu roku 2020. Hlavním cílem této práce je poskytnutí přehledu robustních metod pro identifikaci odlehlých pozorování v regresi, základních vícerozměrných metod identifikace odlehlých pozorování a následné zhodnocení odlišností v získaných výsledných identifikovaných pozorováních ve zkoumaných datech. Mezi další cíle práce patří poskytnutí přehledu a popsání metod vybraných robustních regresních odhadů, na kterých jsou dále založeny zmiňované robustní metody identifikace odlehlých pozorování. Dalším dílčím cílem je porovnání základních a robustních metod identifikace odlehlých pozorování. Práce je rozdělena na dvě části. První část diplomové práce obsahuje teoretické vysvětlení statistických metod. Vybrané metody jsou následně využity pro praktickou aplikaci v její druhé části, a to za účelem vyhodnocení jejich výsledků a jejich schopnosti odhalení odlehlých pozorování v datovém souboru.
Keywords: odlehlá pozorování; regresní analýza; regresní robustní odhady; rezidua
Thesis title: Robust Regression – Identification of Outliers
Author: Hybnerová, Štěpánka
Thesis type: Diploma thesis
Supervisor: Blatná, Dagmar
Opponents: Malec, Lukáš
Thesis language: Česky
Abstract:
This diploma thesis is focused on robust regression – the identification of outliers. Selected robust methods of regression analysis are described theoretically in the thesis. This is followed by the description of classical multidimensional methods for outlier detection and robust methods used for identifying outliers. The latter is based on robust regression estimators. The methods are applied to social and economic data for 2018 describing 27 member states of the European Union which were its members in October 2020. The main aim of this thesis is to introduce selected robust methods used for identifying outliers in regression analysis, to introduce selected classical multidimensional methods for identifying outliers, and to evaluate the differences between the detected outliers in the examined data. The other aim of the thesis is to provide an overview and description of selected methods of robust regression estimators on which the robust methods of outlier identification are based. Finally, this thesis aims to compare classical and robust methods for identifying outliers. The thesis is divided into two parts. The first part describes statistical methods theoretically. These statistical methods are used for practical analysis when pursuing the evaluation of its results and its ability to identify outliers in the data.
Keywords: residual; robust regression estimators; regression analysis; outliers

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 26. 9. 2019
Date of submission: 30. 4. 2021
Date of defense: 9. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/70799/podrobnosti

Files for download

    Last update: