Application of exploratory data analysis in practice

Thesis title: Aplikace průzkumové analýzy dat v praxi
Author: Nyirendová, Rozálie
Thesis type: Bakalářská práce
Supervisor: Danko, Jakub
Opponents: Löster, Tomáš
Thesis language: Česky
Abstract:
Cílem této práce je teoreticky vymezit problematiku průzkumové analýzy a aplikovat její metody v praxi na datovém souboru v jazyce R. Práce sestává ze čtyř částí. První kapitola je zaměřena na deskriptivní statistiku, tedy základní grafické metody zobrazení dat a dále míry polohy, variability, asymetrie a koncentrace. Ve druhé kapitole je podrobně diskutována problematika chybějících dat spolu s možnými příčinami a vhodnými řešeními. Třetí kapitola je zaměřena na odlehlé hodnoty, přičemž důraz je kladen především na možnosti jejich identifikace. Poslední, čtvrtá kapitola se věnuje normalitě dat jakožto základnímu předpokladu pro mnohé statistické metody. Konkrétně je důraz kladen na možnosti ověření pomocí grafických metod a statistických testů.
Keywords: Průzkumová analýza dat; Čištění dat; Analýza dat; R
Thesis title: Application of exploratory data analysis in practice
Author: Nyirendová, Rozálie
Thesis type: Bachelor thesis
Supervisor: Danko, Jakub
Opponents: Löster, Tomáš
Thesis language: Česky
Abstract:
The aim of this paper is to theoretically define the concept of exploratory analysis and apply its methods in practice on a data set in R. The paper consists of four parts. The first chapter is focused on descriptive statistics, for example, basic graphical methods for presenting data and measures of central tendency, variability, asymmetry, and concentration. The second chapter discusses in detail the issue of missing data, along with possible causes and appropriate solutions. The third chapter focuses on outliers, with emphasis on the possibility of their identification. The last, fourth chapter deals with the normality of data as a basic assumption for many statistical methods. Specifically, emphasis is placed on the possibility of verification using graphical methods and statistical tests.
Keywords: Data cleansing; Data analysis; Exploratory data analysis; R

Information about study

Study programme: Kvantitativní metody v ekonomice/Statistika a ekonometrie
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Statistics and Probability

Information on submission and defense

Date of assignment: 20. 11. 2020
Date of submission: 9. 5. 2021
Date of defense: 14. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/75244/podrobnosti

Files for download

    Last update: