Odhad relativní četnosti binomického rozdělení pomocí klasického a bayesovského přístupu v jazyce R
Název práce: | Odhad relativní četnosti binomického rozdělení pomocí klasického a bayesovského přístupu v jazyce R |
---|---|
Autor(ka) práce: | Lauer, Michal |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Vilikus, Ondřej |
Oponenti práce: | Karel, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | Cílem této bakalářské práce je zkoumat různé metody odhadu relativní četnosti binomického rozdělení v bayesovské a frekventistické statistice. V úvodu je kladen důraz na rozdíly mezi přístupy ke statistice, podle kterých se liší použité metody. Frekventistickou statistiku zastupuje metoda maximální věrohodnosti, ze které je odvozen maximálně věrohodný odhad a jeho asymptotická konvergence k normálnímu rozdělení. Bayesovské metody zastupuje beta-binomický model, jehož posteriorní rozdělení je analyticky odvozeno. Bayesovská část je dále rozšířena o představení třech simulačních programů, díky kterým lze simulovat posteriorní rozdělení i bez znalosti analytického řešení. V praktické části jsou porovnány bodové a intervalové odhady pro různé velikosti vzorků a populační relativní četnosti. Výsledky ukazují, že u bodových odhadů je nejvhodnější beta-binomický model s informovaným apriorním rozdělením. V případě hraničních relativních četností nebo malého vzorku je metoda maximální věrohodnosti nevhodná primárně kvůli asymptotickému předpokladu. U intervalových odhadů se ukázalo, že je nejvhodnější beta-binomický model s neinformativním apriorním rozdělením. Znovu se ukazuje, že intervaly vytvořené frekventistickou metodou jsou u malých vzorků a hraničních relativních četností nevhodné. Hlavním přínosem bakalářské práce je zdůraznění praktických výhod bayesovských metod při odhadech s omezenými daty, kde apriorní informace o parametru může částečně kompenzovat nedostatek dat. |
Klíčová slova: | Stan; Bayesovská statistika; Odhad relativní četnosti; Jazyk R; BUGS; JAGS |
Název práce: | Estimating the relative frequency of a binomial distribution using classical and Bayesian approaches in R |
---|---|
Autor(ka) práce: | Lauer, Michal |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Vilikus, Ondřej |
Oponenti práce: | Karel, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | The aim of the bachelor thesis is to investigate different methods of estimating the relative frequency of binomial distribution in Bayesian and Frequentist statistics. In the introduction, emphasis is placed on the differences between the approaches to statistics that distinguish methods used. Frequentist statistics is represented by the maximum likelihood method, which derives the maximum likelihood estimate and its asymptotic convergence to a normal distribution. Bayesian methods are represented by the Beta-Binomial model, whose posterior distribution is analytically derived. The Bayesian part is further extended by the introduction of three simulation programs that can be used to simulate the posterior distributions without knowledge of the analytical solution. The practical part compares point and interval estimates for different sample sizes and population relative frequencies. The results show that for point estimates, the Beta-Binomial is the most appropriate model with informed apriori distribution. In the case of borderline relative frequencies or small sample sizes, the maximum likelihood method is unsuitable primarily because of the asymptotic assumption. In the case of interval estimation, it has been shown to be the same model with a non-informative apriori distribution to be the best. Again, it can be seen that the intervals produced by the frequentist method are more likely to be incorrect in small-samples and borderline relative frequencies. The main contribution of this bachelor thesis is highlighting the practical advantages of Bayesian methods in estimation with limited data, where apriori parameter information can partially compensate for the lack of data. |
Klíčová slova: | BUGS; Bayesian statistics; JAGS; Stan; Language R; Relative frequency estimation |
Informace o studiu
Studijní program / obor: | Data Analytics |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 9. 4. 2024 |
---|---|
Datum podání práce: | 8. 12. 2024 |
Datum obhajoby: | 29. 1. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/88225/podrobnosti |