Consequences of assumption violations of selected statistical methods

Thesis title:	Dôsledky porušenia predpokladov použitia vybraných štatistických metód
Author:	Marcinko, Tomáš
Thesis type:	Dissertation thesis
Supervisor:	Blatná, Dagmar
Opponents:	Malá, Ivana; Lukáš, Ladislav
Thesis language:	Slovensky
Abstract:	Tradičné parametrické metódy štatistickej indukcie a testovania hypotéz sú spravidla odvodené na základe teoretických predpokladov, ktoré môžu, ale nemusia byť splnené v reálnych aplikáciách. V praxi pritom často dochádza k tomu, že tieto metódy sú využívané napriek nesplneniu ich predpokladov, pričom sa vychádza z názoru, že tieto parametrické testové procedúry sú dostatočne necitlivé voči porušeniu príslušných predpokladov. Navyše, alternatívne neparametrické a poradové testy sú často opomínané, a to častokrát z presvedčenia, že tieto metódy dosahujú menšiu silu v porovnaní s parametrickými metódami. Cieľom predkladanej práce je teda popis rizík a dôsledkov použitia klasických jednovýberových a dvojvýberových štatistických metód pri porušení teoretických predpokladov, na základe ktorých boli odvodené, ako aj konzistentné a komplexné porovnanie týchto metód s alternatívnymi neparametrickými a robustnými štatistickými technikami s využitím rozsiahlej simulačnej štúdie, pričom sa práca zameriava predovšetkým na porušenie predpokladu normality a homoskedasticity. Výsledky simulačnej práce potvrdili, že klasické parametrické metódy sú relatívne robustné, aj keď s výhradou v prípade výskytu odľahlých pozorovaní, kedy klasické metódy môžu zlyhávať. Naopak, spracovaná štúdia jasne empiricky dokázala, že klasické parametrické metódy pri porušení svojich predpokladov rýchle strácajú svoje optimálne vlastnosti, a napríklad v mnohých prípadoch porušenia predpokladu normálneho rozdelenia náhodného výberu dosahujú väčšiu silu vhodné neparametrické a poradové testové procedúry, a tak tvrdenie, že použitie týchto metód je neefektívne z dôvodu ich menšej sily, možno považovať za kritický omyl. Výber vhodnej neparametrickej metódy však spravidla závisí na konkrétnej forme rozdelenia náhodného výberu.
Keywords:	rovnomerne najsilnejšie testy; poradové testy; robustné odhady; bootstrap; štatistické testovanie hypotéz; porušenie predpokladov

Thesis title:	Důsledky porušení předpokladů použití vybraných statistických metod
Author:	Marcinko, Tomáš
Thesis type:	Disertační práce
Supervisor:	Blatná, Dagmar
Opponents:	Malá, Ivana; Lukáš, Ladislav
Thesis language:	Slovensky
Abstract:	Tradiční parametrické metody statistické indukce a testování hypotéz jsou zpravidla odvozeny na základě teoretických předpokladů, které mohou, ale nemusí být splněny v reálných aplikacích. V praxi přitom často dochází k tomu, že tyto metody jsou využívány přes nesplnění jejich předpokladů, přičemž se vychází z názoru, že tyto parametrické testové procedury jsou dostatečně necitlivé vůči porušení příslušných předpokladů. Navíc, alternativní neparametrické a pořadové testy jsou často opomíjené, a to častokrát z přesvědčení, že tyto metody dosahují menší sílu v porovnání s parametrickými metodami. Cílem předkládané práce je tedy popis rizik a důsledků použití klasických jednovýběrových a dvouvýběrových statistických metod při porušení teoretických předpokladů, na základě kterých byly odvozeny, jakož i konzistentní a komplexní srovnání těchto metod s alternativními neparametrickými a robustními statistickými technikami s využitím rozsáhlé simulační studie, přičemž se práce zaměřuje především na porušení předpokladu normality a homoskedasticity. Výsledky simulační práce potvrdily, že klasické parametrické metody jsou relativně robustní, i když s výhradou v případě výskytu odlehlých pozorování, kdy klasické metody mohou selhávat. Naopak zpracována studie jasně empiricky prokázala, že klasické parametrické metody při porušení svých předpokladů rychlé ztrácejí své optimální vlastnosti, a například v mnoha případech porušení předpokladu normálního rozdělení náhodného výběru dosahují větší sílu vhodné neparametrické a pořadové testové procedury, a tak tvrzení, že použití těchto metod je neefektivní z důvodu jejich menší síly, lze považovat za kritický omyl. Výběr vhodné neparametrické metody však zpravidla závisí na konkrétní formě rozdělení náhodného výběru.
Keywords:	robustní odhady; statistické testování hypotéz; bootstrap; pořadové testy; rovnoměrně nejsilnější testy; porušení předpokladů

Thesis title:	Consequences of assumption violations of selected statistical methods
Author:	Marcinko, Tomáš
Thesis type:	Dissertation thesis
Supervisor:	Blatná, Dagmar
Opponents:	Malá, Ivana; Lukáš, Ladislav
Thesis language:	Slovensky
Abstract:	Classical parametric methods of statistical inference and hypothesis testing are derived under fundamental theoretical assumptions, which may or may not be met in real world applications. However, these methods are usually used despite the violation of their underlying assumptions, while it is argued, that these methods are quite insensitive to the violation of relevant assumptions. Moreover, alternative nonparametric or rank tests are often overlooked, mostly because these methods may be deemed to be less powerful then parametric methods. The aim of the dissertation is therefore a description of the consequences of assumption violations concerning classical one-sample and two-sample statistical methods and a consistent and comprehensive comparison of parametric, nonparametric and robust statistical techniques, which is based on extensive simulation study and focused mostly on a normality and heteroscedasticity assumption violation. The results of the simulation study confirmed that the classical parametric methods are relatively robust, with some reservations in case of outlying observations, when traditional methods may fail. On the other hand, the empirical study clearly proved that the classical parametric methods are losing their optimal properties, when the underlying assumptions are violated. For example, in many cases of non-normality the appropriate nonparametric and rank-based methods are more powerful, and therefore a statement, that these methods are unproductive due to their lack of power may be considered a crucial mistake. However, the choice of the most appropriate distribution-free method generally depends on the particular form of the underlying distribution.
Keywords:	robust estimates; rank tests; uniformly most powerful tests; assumptions violation; statistical hypothesis testing; bootstrap

Information about study

Study programme:	Kvantitativní metody v ekonomice/Statistika
Type of study programme:	Doktorský studijní program
Assigned degree:	Ph.D.
Institutions assigning academic degree:	Vysoká škola ekonomická v Praze
Faculty:	Faculty of Informatics and Statistics
Department:	Department of Statistics and Probability

Information on submission and defense

Date of assignment:	5. 10. 2010
Date of submission:	31. 5. 2013
Date of defense:	7. 9. 2016
Identifier in the InSIS system:	https://insis.vse.cz/zp/27772/podrobnosti

Files for download

Main text
27772_xmart14.pdf, 4 MB Download

Příloha práce
13878_xmart14.zip, 14 MB Download

Opponent's review
48439_malai.pdf, 343.1 kB Download

Opponent's review
48440_Lukáš.pdf, 82.9 kB Download

Supervisor's review
27772_blatna.pdf, 130.5 kB Download