Směsi pravděpodobnostních rozdělení a jejich aplikace

Název práce: Směsi pravděpodobnostních rozdělení a jejich aplikace
Autor(ka) práce: Škrobánek, Jakub
Typ práce: Diplomová práce
Vedoucí práce: Malá, Ivana
Oponenti práce: Bílková, Diana
Jazyk práce: Česky
Abstrakt:
Tato práce se zaměřuje na konečné směsi pravděpodobnostních rozdělení. Primárním cílem je seznámit čtenáře s obecnou i hlubší problematikou v této oblasti. Celý text je rozdělen do tří částí. První část práce se věnuje teoretickému popisu vybraných metod. Popsány jsou obecné principy fungování pravděpodobnostních směsí, grafické metody odhadu parametrů směsí a odhady pomocí EM algoritmu. Dále jsou naznačeny i jiné možné postupy týkající se modelování pomocí směsí. Je popsána také spojitost směsí rozdělení se shlukovou analýzou. Druhá část, jejíž charakter je spíše informativní, je zaměřena na popis dat, na kterých jsou vybrané metody aplikovány. Data pocházejí ze statistického šetření Životní podmínky prováděného Českým statistickým úřadem. Analyzovaným ukazatelem je roční disponibilní příjem domácnosti. Jako pomocná proměnná pak slouží počet členů domácnosti.Poslední úsek práce je zaměřen na praktickou aplikaci. Nejprve je na vygenerovaných datech přiblížen pomocí názorných ukázek základní princip fungování směsí. Je také popsán způsob generování dat z pravděpodobnostních směsí. Nakonec jsou analyzována data popsaná ve druhé části. Odhady parametrů směsi popisující roční disponibilní příjem jsou provedeny pomocí grafických metod, pomocí EM algoritmu či maximálně věrohodnou metodou. Nejkvalitnější výsledky byly získány právě pomocí EM algoritmu. Tento algoritmus je také aplikován při přítomností doprovodné proměnné popisující počet členů domácnosti. I tímto modelem byl získán kvalitní výsledek.
Klíčová slova: disponibilní příjem; EM algoritmus; odhady parametrů; grafické metody; konečná směs
Název práce: Mixtures of probability distributions and their application
Autor(ka) práce: Škrobánek, Jakub
Typ práce: Diploma thesis
Vedoucí práce: Malá, Ivana
Oponenti práce: Bílková, Diana
Jazyk práce: Česky
Abstrakt:
This thesis is focused on finite mixtures of probability distributions. The primary goal is to acquaint readers with general and also deeper issues in this area. The whole text is divided into three parts. The first part is devoted to the theoretical description of selected methods. General principles of probabilistic mixtures, graphical methods for estimation of mixture parameters and estimation using EM algorithm are described. In addition, other possible methods for modeling with mixtures are outlined. The connection of the mixture models with the cluster analysis is also described. The second part, whose character is rather informative, focuses on the description of the data on which the selected methods are applied. The data come from the statistical survey Living conditions conducted by the Czech Statistical Office. The analyzed indicator is the annual disposable household income. The number of household members serves as an auxiliary variable. The last part of the thesis is focused on practical application. First of all, the basic principle of mixtures is described on the generated data by means of illustrations. Described is also a method of generating data from probability mixtures. Finally, the data described in the second part are analyzed. Estimates of the mixture parameters describing the annual disposable household income are made using graphical methods, EM algorithm and MLE. The best results were obtained using the EM algorithm. This algorithm is also applied in the presence of an auxiliary variable describing the number of household members. This model has also produced a good result.
Klíčová slova: disposable income; EM algorithm; graphical methods; parameter estimation; finite mixture

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Statistika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 24. 6. 2019
Datum podání práce: 16. 4. 2020
Datum obhajoby: 9. 6. 2020
Identifikátor v systému InSIS: https://insis.vse.cz/zp/70098/podrobnosti

Soubory ke stažení

    Poslední aktualizace: