Komparace vizualizace dat ve statistických výpočetních prostředí

Název práce: Komparace vizualizace dat ve statistických výpočetních prostředí
Autor(ka) práce: Tomášková, Tereza
Typ práce: Bakalářská práce
Vedoucí práce: Danko, Jakub
Oponenti práce: Löster, Tomáš
Jazyk práce: Česky
Abstrakt:
Cílem této práce je porovnat způsoby vizualizace ve třech výpočetních statistických prostředích, a to za použití jazyků R, Python a SAS. Práce sestává ze sedmi částí. V první jsou představeny ukazatele popisné statistiky, které jsou děleny na úrovně míry a variability. Druhá kapitola se soustředí na nejčastěji používané typy grafů, představení jejich výhod, nevýhod a vymezení, kdy je vhodné je použít. Další kapitola se zabývá představením jazyka R. Důraz je kladen na datové struktury, v nichž je možno data uchovávat a následně vizualizovat. Podobný přístup je volen v kapitole čtyři a pět, s tím rozdílem, že se zde jedná o jazyky Python a SAS. U SASu jsou navíc představeny základy práce v jazyku SQL, který lze v tomto prostředí také používat. Další kapitolou jsou samotné vizualizace, kdy je možno porovnat přístupy, jež se využívají v jednotlivých výpočetních prostředích. Prve jsou vizualizovány grafy v R, poté v Pythonu, a nakonec v SASu. Poslední kapitola se zaměřuje na komparaci těchto prostředí a na tvorbu doporučení pro jejich uživatele.
Klíčová slova: popisná statistika; Python; R; SAS; vizualizace
Název práce: Comparison of data visualizations in statistical computing environments
Autor(ka) práce: Tomášková, Tereza
Typ práce: Bachelor thesis
Vedoucí práce: Danko, Jakub
Oponenti práce: Löster, Tomáš
Jazyk práce: Česky
Abstrakt:
The aim of this thesis is to compare ways, in which visualizations in statistical environments differ, namely in R, Python and SAS. The paper consists of seven parts. The first chapter focuses on the description of various indicators used in descriptive statistics. These are divided into measures of central tendency and measures of variability. The next chapter introduces the most used types of graphs, describes their advantages, disadvantages, and explains when each graph should be used. The following three parts serve as theoretical introductions to each programming language, starting with R, then introducing Python, and finishing with SAS. The sixth chapter deals with the visualizations and the final part is dedicated to comparison of all the environments.
Klíčová slova: R; visualization; descriptive statistics; Python; SAS

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 24. 8. 2021
Datum podání práce: 8. 5. 2022
Datum obhajoby: 15. 6. 2022
Identifikátor v systému InSIS: https://insis.vse.cz/zp/77512/podrobnosti

Soubory ke stažení

    Poslední aktualizace: