Comparison of data visualizations in statistical computing environments

Thesis title: Komparace vizualizace dat ve statistických výpočetních prostředí
Author: Tomášková, Tereza
Thesis type: Bakalářská práce
Supervisor: Danko, Jakub
Opponents: Löster, Tomáš
Thesis language: Česky
Abstract:
Cílem této práce je porovnat způsoby vizualizace ve třech výpočetních statistických prostředích, a to za použití jazyků R, Python a SAS. Práce sestává ze sedmi částí. V první jsou představeny ukazatele popisné statistiky, které jsou děleny na úrovně míry a variability. Druhá kapitola se soustředí na nejčastěji používané typy grafů, představení jejich výhod, nevýhod a vymezení, kdy je vhodné je použít. Další kapitola se zabývá představením jazyka R. Důraz je kladen na datové struktury, v nichž je možno data uchovávat a následně vizualizovat. Podobný přístup je volen v kapitole čtyři a pět, s tím rozdílem, že se zde jedná o jazyky Python a SAS. U SASu jsou navíc představeny základy práce v jazyku SQL, který lze v tomto prostředí také používat. Další kapitolou jsou samotné vizualizace, kdy je možno porovnat přístupy, jež se využívají v jednotlivých výpočetních prostředích. Prve jsou vizualizovány grafy v R, poté v Pythonu, a nakonec v SASu. Poslední kapitola se zaměřuje na komparaci těchto prostředí a na tvorbu doporučení pro jejich uživatele.
Keywords: popisná statistika; Python; R; SAS; vizualizace
Thesis title: Comparison of data visualizations in statistical computing environments
Author: Tomášková, Tereza
Thesis type: Bachelor thesis
Supervisor: Danko, Jakub
Opponents: Löster, Tomáš
Thesis language: Česky
Abstract:
The aim of this thesis is to compare ways, in which visualizations in statistical environments differ, namely in R, Python and SAS. The paper consists of seven parts. The first chapter focuses on the description of various indicators used in descriptive statistics. These are divided into measures of central tendency and measures of variability. The next chapter introduces the most used types of graphs, describes their advantages, disadvantages, and explains when each graph should be used. The following three parts serve as theoretical introductions to each programming language, starting with R, then introducing Python, and finishing with SAS. The sixth chapter deals with the visualizations and the final part is dedicated to comparison of all the environments.
Keywords: R; visualization; descriptive statistics; Python; SAS

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 24. 8. 2021
Date of submission: 8. 5. 2022
Date of defense: 15. 6. 2022
Identifier in the InSIS system: https://insis.vse.cz/zp/77512/podrobnosti

Files for download

    Last update: