The graphical data analysis in various statistical computing systems

Thesis title: Grafická analýza dat v různých výpočetních systémech
Author: Maroušek, Vít
Thesis type: Bakalářská práce
Supervisor: Pecáková, Iva
Opponents: Černý, Jindřich
Thesis language: Česky
Abstract:
Cílem mé práce je poukázat na možnosti grafické analýzy v počítačových systémech. Tato oblast se stále vyvíjí, objevují se nové metody a již známé techniky se rozvíjí. Práce je rozdělena do tří částí, jedna je teoretická, jedná porovnávací a jedna obecná s nabídkou alternativ ke stávajícím technikám. První část práce je teoretická a věnuje se klasifikaci statistických proměnných. Pro počítačové systémy zde navrhuji klasifikaci zjednodušenou kvůli způsobu, jakým jsou některé typy proměnných zpracovávány. Druhá kapitola porovnává výstupy některých klasických metod a jejich zpracování v třech nejrozšířenějších statistických systémech SAS, SPSS a STATISTICA. Porovnání je ve formě tabulek s detailním popisem vlastností a přiložen je ukázkový graf z každého systému. V závěrečné kapitole se soustředím na prezentaci některých dalších klasických metod grafické analýzy a jejich použití. Většina kapitoly je ale věnována novým, či dosud méně rozšířeným technikám. Jsou zde uvedeny grafy, které nebyly popsány ještě v žádné české literatuře. Téměř všechny grafy, které v práci prezentuji, jsem vytvořil pro tuto práci v popsaných systémech. Pouze dva jsou převzaty, protože se vyskytly vážné překážky, které jsem neměl možnost překonat.
Keywords: STATISTICA; statistika; SAS; grafická analýza; R; grafy; SPSS; klasifikace proměnných
Thesis title: The graphical data analysis in various statistical computing systems
Author: Maroušek, Vít
Thesis type: Bachelor thesis
Supervisor: Pecáková, Iva
Opponents: Černý, Jindřich
Thesis language: Česky
Abstract:
Goal of my thesis is to show and compare various ways of graphical data analysis in statistical computing systems. This area is still developing, new techniques are being discovered and the already known are being developed. This work is split into three parts, one theoretical, one comparing and one general with new ideas. The first part is theoretical and is dedicated to classification of statistical variables. For statistical computing systems I offer a simplified classification because of the way they treat some types of variables. Second part of my work compares graphical outputs of three most used statistical computing systems SAS, SPSS and STATISTICA. This comparison is based on some of the most commonly used graphical methods. The outputs are tables with detailed description and examples of graphs from each system are attached. The last part is focused on the general graphical data exploration and follows the simplified classification of variables. In this part I use common graphical techniques and introduce some new or fewer used techniques. Many of them haven't been described in any Czech literature yet. Almost all the graphs presented in this work were created by me in various statistical computing systems. Two were copied from literature because of serious problems with the process of their creation.
Keywords: R; comparison; graphs; statistical; SPSS; SAS; graphical data analysis; plot

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistika a ekonometrie
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 28. 9. 2008
Date of submission: 20. 12. 2008
Date of defense: 2. 2. 2009
Identifier in the InSIS system: https://insis.vse.cz/zp/15105/podrobnosti

Files for download

    Last update: