Computer software for conversion between different ways of representation of statistical data in CSV format

Thesis title: Aplikace na konverzi mezi různými způsoby reprezentace statistických dat ve formátu CSV
Author: Havlík, Martin
Thesis type: Bakalářská práce
Supervisor: Kučera, Jan
Opponents: Palovská, Helena
Thesis language: Česky
Abstract:
Práce se zabývá transformací dat mezi různými způsoby reprezentace statistických dat ve formátu CSV. Práce má dva cíle.Prvním cílem je porovnat různé přístupy k publikaci statistických dat, s důrazem na porovnání publikace statistických dat ve formátu CSV s jinými přístupy k publikaci těchto dat. Pro dosažení cíle se identifikovaly skupiny uživatelů statistických dat podle analogie společných vlastností uživatelů popsaných ve zdrojích informací k této práci. Tyto skupiny se na základě syntézy jejich vlastností zakreslily do matice. Dále došlo k identifikaci vhodných formátů pro publikaci statistických dat. Na tyto formáty se aplikovala komparace na základě definovaných kritérií vzniklých analýzou skupin uživatelů. Tím došlo k ohodnocení formátů. Formáty se pak na základě ohodnocení promítly do vytvořené matice uživatelů statistických dat. Na základě čehož lze zjistit, pro jakou kategorii uživatelů se hodí, jaký formát. Druhým cílem je navrhnout a implementovat aplikaci na konverzi mezi různými způsoby reprezentace statistických dat ve formátu CSV. Pro dosažení cíle bylo nutné analyzovat datovou strukturu statistických dat ve formátu CSV a identifikovat požadavky na aplikaci. Poté byl na základě zjištěných informací vytvořen návrh aplikace. Nakonec došlo k implementaci návrhu a otestování aplikace. Výsledkem práce je kategorizace formátů na základě skupin uživatelů statických dat a funkční modulární aplikace, umožňující transformaci dat z jednoho způsobu reprezentace statistických dat ve formátu CSV do jiného. Do této aplikace lze dodatečně přidávat další moduly pro práci s formáty.
Keywords: CSV; kategorizace uživatelů; konvertor; modulární aplikace; srovnání formátů; statistická data; transformace dat
Thesis title: Computer software for conversion between different ways of representation of statistical data in CSV format
Author: Havlík, Martin
Thesis type: Bachelor thesis
Supervisor: Kučera, Jan
Opponents: Palovská, Helena
Thesis language: Česky
Abstract:
The research topic of the thesis deals with the transformation of statistical data between various representations in CSV format. The thesis has two main goals.The first goal is to compare different approaches of the publication of statistical data, with a focus on comparison of statistical data in CSV format with other approaches. In order to fulfil this goal, an identification of groups of statistical data’s users is carried out, based on the analogy of common characteristics of the users, which are described in the sources of information of this work. These groups of users, based on the synthesized characteristics, are drawn into a matrix. Hereafter an identification of suitable formats for statistical data publication is introduced. These formats are compared based on the defined criteria which are listed in the analysis of the groups of users. This process leads to the evaluation of the formats. They further, according to the evaluation, are projected into statistical data users’ matrix. The results thus show which format is suited for which category of groups of users.The second goal is to design and implement a computer software for conversion between different ways of representation of statistical data in CSV format. In order to accomplish this goal, it is necessary to analyse the data structure of statistical data in CSV format and identify requirements of the software functions. After that, on the basis of acquired knowledge, a software is designed, tested and implemented.The result of this thesis is the categorization of formats based on groups of statistical data users and the modular software, which transforms statistical data from one way of representation of CSV format to another. This software is open-source which enables users to add more modules in the future.
Keywords: CSV; converter; data transformation; format comparison; modular application; statistical data; user categorization

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 17. 10. 2018
Date of submission: 22. 4. 2019
Date of defense: 13. 6. 2019
Identifier in the InSIS system: https://insis.vse.cz/zp/67415/podrobnosti

Files for download

    Last update: