Statistical inference for categorical data analysis

Thesis title: Statistické usuzování v analýze kategoriálních dat
Author: Kocáb, Jan
Thesis type: Diplomová práce
Supervisor: Pecáková, Iva
Opponents: Coufalová, Petra
Thesis language: Česky
Tato práce se zabývá statistickými metodami v analýze kategoriálních dat. Tyto metody jsou rozšířené především v sociálních vědách jako sociologie, psychologie nebo politologie, ale jejich význam vzrůstá také v medicíně a technických vědách. V první části je věnována pozornost úsudkům o relativní četnosti. Jsou zde popsány klasické, exaktní a Bayesovské způsoby odhadů a testování hypotéz. Uvažován je případ velkého výběru, kdy lze nahradit přesné rozdělení normálním, tak případ malého výběru, kdy aproximace není možná a je nutné použít nespojité rozdělení, z čehož vznikají specifické problémy. Druhá část je zaměřena na analýzu dvou kategoriálních proměnných v kontingenčních tabulkách. Jsou zde objasněny pojmy jako rozdíl relativních četností nebo poměr šancí a je rovněž ukázáno, jak se testuje nezávislost proměnných v případě velkého a malého výběru. V případě malého výběru nelze použít klasické chí-kvadrát testy nezávislosti a je nutno využít alternativní metody. V této části jsou vysvětleny různé exaktní testy a také Bayesovský přístup v kontingenčních tabulkách typu 2 x 2. Konec této části je věnován tabulce pro dva závislé výběry, kde nás zajímá, zda se v populaci shoduje zastoupení kategorií dvojice proměnných, což nastává při stejných marginálních relativních četnostech obou proměnných. V poslední části práce jsou metody použity na datech a okomentovány výsledky.
Keywords: Exaktní metody; Relativní četnost; Kategoriální data; Kontingenční tabulky; Bayesovský přístup
Thesis title: Statistical inference for categorical data analysis
Author: Kocáb, Jan
Thesis type: Diploma thesis
Supervisor: Pecáková, Iva
Opponents: Coufalová, Petra
Thesis language: Česky
This thesis introduces statistical methods for categorical data. These methods are especially used in social sciences such as sociology, psychology and political science, but their importance has increased also in medical and technical sciences. In the first part there is mentioned statistical inference for a proportion. Here is written about classical, exact and Bayesian methods for estimating and hypothesis testing. If we have a large sample then we can approximate exact distribution by normal distribution but if we have a small sample cannot use this approximation and it is necessary to use discrete distribution which makes inference more complicated. The second part deals with two categorical variables analysis in contingency tables. Here are explained measures of association for 2 x 2 contingency tables such as difference of proportion and odds ratio and also presented how we can test independence in the case of large sample and small one. If we have small sample we are not allowed to use classical chi-squared tests and it is necessary to use alternative methods. This part contains variety of exact tests of independence and Bayesian approach for the 2 x 2 table too. In the end of this part there is written about a table for two dependent samples and we are interested whether two variables give identical results which occurs when marginal proportions are equal. In the last part there are methods used on data and discussed results.
Keywords: Contingency tables; Categorical data; Exact methods; Bayesian approach; Proportion

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistické a pojistné inženýrství
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 27. 1. 2010
Date of submission: 31. 5. 2011
Date of defense: 15. 6. 2011
Identifier in the InSIS system:

Files for download

    Last update: