Estimating the relative frequency of a binomial distribution using classical and Bayesian approaches in R

Thesis title: Odhad relativní četnosti binomického rozdělení pomocí klasického a bayesovského přístupu v jazyce R
Author: Lauer, Michal
Thesis type: Bakalářská práce
Supervisor: Vilikus, Ondřej
Opponents: Karel, Tomáš
Thesis language: Česky
Abstract:
Cílem této bakalářské práce je zkoumat různé metody odhadu relativní četnosti binomického rozdělení v bayesovské a frekventistické statistice. V úvodu je kladen důraz na rozdíly mezi přístupy ke statistice, podle kterých se liší použité metody. Frekventistickou statistiku zastupuje metoda maximální věrohodnosti, ze které je odvozen maximálně věrohodný odhad a jeho asymptotická konvergence k normálnímu rozdělení. Bayesovské metody zastupuje beta-binomický model, jehož posteriorní rozdělení je analyticky odvozeno. Bayesovská část je dále rozšířena o představení třech simulačních programů, díky kterým lze simulovat posteriorní rozdělení i bez znalosti analytického řešení. V praktické části jsou porovnány bodové a intervalové odhady pro různé velikosti vzorků a populační relativní četnosti. Výsledky ukazují, že u bodových odhadů je nejvhodnější beta-binomický model s informovaným apriorním rozdělením. V případě hraničních relativních četností nebo malého vzorku je metoda maximální věrohodnosti nevhodná primárně kvůli asymptotickému předpokladu. U intervalových odhadů se ukázalo, že je nejvhodnější beta-binomický model s neinformativním apriorním rozdělením. Znovu se ukazuje, že intervaly vytvořené frekventistickou metodou jsou u malých vzorků a hraničních relativních četností nevhodné. Hlavním přínosem bakalářské práce je zdůraznění praktických výhod bayesovských metod při odhadech s omezenými daty, kde apriorní informace o parametru může částečně kompenzovat nedostatek dat.
Keywords: Stan; Bayesovská statistika; Odhad relativní četnosti; Jazyk R; BUGS; JAGS
Thesis title: Estimating the relative frequency of a binomial distribution using classical and Bayesian approaches in R
Author: Lauer, Michal
Thesis type: Bachelor thesis
Supervisor: Vilikus, Ondřej
Opponents: Karel, Tomáš
Thesis language: Česky
Abstract:
The aim of the bachelor thesis is to investigate different methods of estimating the relative frequency of binomial distribution in Bayesian and Frequentist statistics. In the introduction, emphasis is placed on the differences between the approaches to statistics that distinguish methods used. Frequentist statistics is represented by the maximum likelihood method, which derives the maximum likelihood estimate and its asymptotic convergence to a normal distribution. Bayesian methods are represented by the Beta-Binomial model, whose posterior distribution is analytically derived. The Bayesian part is further extended by the introduction of three simulation programs that can be used to simulate the posterior distributions without knowledge of the analytical solution. The practical part compares point and interval estimates for different sample sizes and population relative frequencies. The results show that for point estimates, the Beta-Binomial is the most appropriate model with informed apriori distribution. In the case of borderline relative frequencies or small sample sizes, the maximum likelihood method is unsuitable primarily because of the asymptotic assumption. In the case of interval estimation, it has been shown to be the same model with a non-informative apriori distribution to be the best. Again, it can be seen that the intervals produced by the frequentist method are more likely to be incorrect in small-samples and borderline relative frequencies. The main contribution of this bachelor thesis is highlighting the practical advantages of Bayesian methods in estimation with limited data, where apriori parameter information can partially compensate for the lack of data.
Keywords: BUGS; Bayesian statistics; JAGS; Stan; Language R; Relative frequency estimation

Information about study

Study programme: Data Analytics
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 9. 4. 2024
Date of submission: 8. 12. 2024
Date of defense: 29. 1. 2025
Identifier in the InSIS system: https://insis.vse.cz/zp/88225/podrobnosti

Files for download

    Last update: