Komparace vizualizace dat ve statistických výpočetních prostředí
Název práce: | Komparace vizualizace dat ve statistických výpočetních prostředí |
---|---|
Autor(ka) práce: | Tomášková, Tereza |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Danko, Jakub |
Oponenti práce: | Löster, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | Cílem této práce je porovnat způsoby vizualizace ve třech výpočetních statistických prostředích, a to za použití jazyků R, Python a SAS. Práce sestává ze sedmi částí. V první jsou představeny ukazatele popisné statistiky, které jsou děleny na úrovně míry a variability. Druhá kapitola se soustředí na nejčastěji používané typy grafů, představení jejich výhod, nevýhod a vymezení, kdy je vhodné je použít. Další kapitola se zabývá představením jazyka R. Důraz je kladen na datové struktury, v nichž je možno data uchovávat a následně vizualizovat. Podobný přístup je volen v kapitole čtyři a pět, s tím rozdílem, že se zde jedná o jazyky Python a SAS. U SASu jsou navíc představeny základy práce v jazyku SQL, který lze v tomto prostředí také používat. Další kapitolou jsou samotné vizualizace, kdy je možno porovnat přístupy, jež se využívají v jednotlivých výpočetních prostředích. Prve jsou vizualizovány grafy v R, poté v Pythonu, a nakonec v SASu. Poslední kapitola se zaměřuje na komparaci těchto prostředí a na tvorbu doporučení pro jejich uživatele. |
Klíčová slova: | popisná statistika; Python; R; SAS; vizualizace |
Název práce: | Comparison of data visualizations in statistical computing environments |
---|---|
Autor(ka) práce: | Tomášková, Tereza |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Danko, Jakub |
Oponenti práce: | Löster, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | The aim of this thesis is to compare ways, in which visualizations in statistical environments differ, namely in R, Python and SAS. The paper consists of seven parts. The first chapter focuses on the description of various indicators used in descriptive statistics. These are divided into measures of central tendency and measures of variability. The next chapter introduces the most used types of graphs, describes their advantages, disadvantages, and explains when each graph should be used. The following three parts serve as theoretical introductions to each programming language, starting with R, then introducing Python, and finishing with SAS. The sixth chapter deals with the visualizations and the final part is dedicated to comparison of all the environments. |
Klíčová slova: | R; visualization; descriptive statistics; Python; SAS |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 24. 8. 2021 |
---|---|
Datum podání práce: | 8. 5. 2022 |
Datum obhajoby: | 15. 6. 2022 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/77512/podrobnosti |