Application of exploratory data analysis in practice
Thesis title: | Aplikace průzkumové analýzy dat v praxi |
---|---|
Author: | Nyirendová, Rozálie |
Thesis type: | Bakalářská práce |
Supervisor: | Danko, Jakub |
Opponents: | Löster, Tomáš |
Thesis language: | Česky |
Abstract: | Cílem této práce je teoreticky vymezit problematiku průzkumové analýzy a aplikovat její metody v praxi na datovém souboru v jazyce R. Práce sestává ze čtyř částí. První kapitola je zaměřena na deskriptivní statistiku, tedy základní grafické metody zobrazení dat a dále míry polohy, variability, asymetrie a koncentrace. Ve druhé kapitole je podrobně diskutována problematika chybějících dat spolu s možnými příčinami a vhodnými řešeními. Třetí kapitola je zaměřena na odlehlé hodnoty, přičemž důraz je kladen především na možnosti jejich identifikace. Poslední, čtvrtá kapitola se věnuje normalitě dat jakožto základnímu předpokladu pro mnohé statistické metody. Konkrétně je důraz kladen na možnosti ověření pomocí grafických metod a statistických testů. |
Keywords: | Průzkumová analýza dat; Čištění dat; Analýza dat; R |
Thesis title: | Application of exploratory data analysis in practice |
---|---|
Author: | Nyirendová, Rozálie |
Thesis type: | Bachelor thesis |
Supervisor: | Danko, Jakub |
Opponents: | Löster, Tomáš |
Thesis language: | Česky |
Abstract: | The aim of this paper is to theoretically define the concept of exploratory analysis and apply its methods in practice on a data set in R. The paper consists of four parts. The first chapter is focused on descriptive statistics, for example, basic graphical methods for presenting data and measures of central tendency, variability, asymmetry, and concentration. The second chapter discusses in detail the issue of missing data, along with possible causes and appropriate solutions. The third chapter focuses on outliers, with emphasis on the possibility of their identification. The last, fourth chapter deals with the normality of data as a basic assumption for many statistical methods. Specifically, emphasis is placed on the possibility of verification using graphical methods and statistical tests. |
Keywords: | Data cleansing; Data analysis; Exploratory data analysis; R |
Information about study
Study programme: | Kvantitativní metody v ekonomice/Statistika a ekonometrie |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Statistics and Probability |
Information on submission and defense
Date of assignment: | 20. 11. 2020 |
---|---|
Date of submission: | 9. 5. 2021 |
Date of defense: | 14. 6. 2021 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/75244/podrobnosti |