Comparison of data visualizations in statistical computing environments
Thesis title: | Komparace vizualizace dat ve statistických výpočetních prostředí |
---|---|
Author: | Tomášková, Tereza |
Thesis type: | Bakalářská práce |
Supervisor: | Danko, Jakub |
Opponents: | Löster, Tomáš |
Thesis language: | Česky |
Abstract: | Cílem této práce je porovnat způsoby vizualizace ve třech výpočetních statistických prostředích, a to za použití jazyků R, Python a SAS. Práce sestává ze sedmi částí. V první jsou představeny ukazatele popisné statistiky, které jsou děleny na úrovně míry a variability. Druhá kapitola se soustředí na nejčastěji používané typy grafů, představení jejich výhod, nevýhod a vymezení, kdy je vhodné je použít. Další kapitola se zabývá představením jazyka R. Důraz je kladen na datové struktury, v nichž je možno data uchovávat a následně vizualizovat. Podobný přístup je volen v kapitole čtyři a pět, s tím rozdílem, že se zde jedná o jazyky Python a SAS. U SASu jsou navíc představeny základy práce v jazyku SQL, který lze v tomto prostředí také používat. Další kapitolou jsou samotné vizualizace, kdy je možno porovnat přístupy, jež se využívají v jednotlivých výpočetních prostředích. Prve jsou vizualizovány grafy v R, poté v Pythonu, a nakonec v SASu. Poslední kapitola se zaměřuje na komparaci těchto prostředí a na tvorbu doporučení pro jejich uživatele. |
Keywords: | popisná statistika; Python; R; SAS; vizualizace |
Thesis title: | Comparison of data visualizations in statistical computing environments |
---|---|
Author: | Tomášková, Tereza |
Thesis type: | Bachelor thesis |
Supervisor: | Danko, Jakub |
Opponents: | Löster, Tomáš |
Thesis language: | Česky |
Abstract: | The aim of this thesis is to compare ways, in which visualizations in statistical environments differ, namely in R, Python and SAS. The paper consists of seven parts. The first chapter focuses on the description of various indicators used in descriptive statistics. These are divided into measures of central tendency and measures of variability. The next chapter introduces the most used types of graphs, describes their advantages, disadvantages, and explains when each graph should be used. The following three parts serve as theoretical introductions to each programming language, starting with R, then introducing Python, and finishing with SAS. The sixth chapter deals with the visualizations and the final part is dedicated to comparison of all the environments. |
Keywords: | R; visualization; descriptive statistics; Python; SAS |
Information about study
Study programme: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Statistics and Probability |
Information on submission and defense
Date of assignment: | 24. 8. 2021 |
---|---|
Date of submission: | 8. 5. 2022 |
Date of defense: | 15. 6. 2022 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/77512/podrobnosti |