Využití statistických metod v hodnocení datové kvality

Název práce: Využití statistických metod v hodnocení datové kvality
Autor(ka) práce: Sládek, David
Typ práce: Diplomová práce
Vedoucí práce: Sobíšek, Lukáš
Oponenti práce: Šulc, Zdeněk
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zaměřuje na problematiku kvantifikace datové kvality. Datová kvalita je téma, na který by měl být brán ohled před jakýmkoli statistickým výzkumem, neboť analýzy vystavené nad nepřesnými, zkreslenými, nebo neúplnými daty nemusejí podávat zobecnitelné závěry. K tomuto účelu je pro rychlé vyhodnocení datové kvality datové sady navržen princip měření pomocí takzvaného indexu datové kvality (DQI).Druhá část práce se zaměřuje na praktické využití DQI v registru pacientů s roztroušenou sklerózou (ReMuS) a tvorbě uživatelské aplikace, která umožňuje vyhodnocení DQI širší veřejnosti.
Klíčová slova: roztroušená skleróza; datová kvalita; index datové kvality; R; Shiny
Název práce: Use of statistical methods in data quality evaluation
Autor(ka) práce: Sládek, David
Typ práce: Diploma thesis
Vedoucí práce: Sobíšek, Lukáš
Oponenti práce: Šulc, Zdeněk
Jazyk práce: Česky
Abstrakt:
This diploma thesis focuses on data quality quantification. Data quality is a topic that should be considered before any statistical research, as analyzes exposed to inaccurate, biased or incomplete data do not have to provide generalizable conclusions. For this purpose, the principle of measurement using the so-called data quality index (DQI) is designed to quickly evaluate the data quality of the data-set.The second part of the thesis focuses on the practical use of DQI in the registry of patients with multiple sclerosis (ReMuS) and the creation of a an application that enables the evaluation of DQI to the general public.
Klíčová slova: data quality; multiple sclerosis; data quality index; R; Shiny

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Statistika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 11. 6. 2018
Datum podání práce: 4. 5. 2020
Datum obhajoby: 9. 6. 2020
Identifikátor v systému InSIS: https://insis.vse.cz/zp/66157/podrobnosti

Soubory ke stažení

    Poslední aktualizace: