Mixtures of probability distributions and their application

Thesis title: Směsi pravděpodobnostních rozdělení a jejich aplikace
Author: Škrobánek, Jakub
Thesis type: Diplomová práce
Supervisor: Malá, Ivana
Opponents: Bílková, Diana
Thesis language: Česky
Abstract:
Tato práce se zaměřuje na konečné směsi pravděpodobnostních rozdělení. Primárním cílem je seznámit čtenáře s obecnou i hlubší problematikou v této oblasti. Celý text je rozdělen do tří částí. První část práce se věnuje teoretickému popisu vybraných metod. Popsány jsou obecné principy fungování pravděpodobnostních směsí, grafické metody odhadu parametrů směsí a odhady pomocí EM algoritmu. Dále jsou naznačeny i jiné možné postupy týkající se modelování pomocí směsí. Je popsána také spojitost směsí rozdělení se shlukovou analýzou. Druhá část, jejíž charakter je spíše informativní, je zaměřena na popis dat, na kterých jsou vybrané metody aplikovány. Data pocházejí ze statistického šetření Životní podmínky prováděného Českým statistickým úřadem. Analyzovaným ukazatelem je roční disponibilní příjem domácnosti. Jako pomocná proměnná pak slouží počet členů domácnosti.Poslední úsek práce je zaměřen na praktickou aplikaci. Nejprve je na vygenerovaných datech přiblížen pomocí názorných ukázek základní princip fungování směsí. Je také popsán způsob generování dat z pravděpodobnostních směsí. Nakonec jsou analyzována data popsaná ve druhé části. Odhady parametrů směsi popisující roční disponibilní příjem jsou provedeny pomocí grafických metod, pomocí EM algoritmu či maximálně věrohodnou metodou. Nejkvalitnější výsledky byly získány právě pomocí EM algoritmu. Tento algoritmus je také aplikován při přítomností doprovodné proměnné popisující počet členů domácnosti. I tímto modelem byl získán kvalitní výsledek.
Keywords: disponibilní příjem; EM algoritmus; odhady parametrů; grafické metody; konečná směs
Thesis title: Mixtures of probability distributions and their application
Author: Škrobánek, Jakub
Thesis type: Diploma thesis
Supervisor: Malá, Ivana
Opponents: Bílková, Diana
Thesis language: Česky
Abstract:
This thesis is focused on finite mixtures of probability distributions. The primary goal is to acquaint readers with general and also deeper issues in this area. The whole text is divided into three parts. The first part is devoted to the theoretical description of selected methods. General principles of probabilistic mixtures, graphical methods for estimation of mixture parameters and estimation using EM algorithm are described. In addition, other possible methods for modeling with mixtures are outlined. The connection of the mixture models with the cluster analysis is also described. The second part, whose character is rather informative, focuses on the description of the data on which the selected methods are applied. The data come from the statistical survey Living conditions conducted by the Czech Statistical Office. The analyzed indicator is the annual disposable household income. The number of household members serves as an auxiliary variable. The last part of the thesis is focused on practical application. First of all, the basic principle of mixtures is described on the generated data by means of illustrations. Described is also a method of generating data from probability mixtures. Finally, the data described in the second part are analyzed. Estimates of the mixture parameters describing the annual disposable household income are made using graphical methods, EM algorithm and MLE. The best results were obtained using the EM algorithm. This algorithm is also applied in the presence of an auxiliary variable describing the number of household members. This model has also produced a good result.
Keywords: disposable income; EM algorithm; graphical methods; parameter estimation; finite mixture

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistika
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 24. 6. 2019
Date of submission: 16. 4. 2020
Date of defense: 9. 6. 2020
Identifier in the InSIS system: https://insis.vse.cz/zp/70098/podrobnosti

Files for download

    Last update: