Využití statistických metod v hodnocení datové kvality
Název práce: | Využití statistických metod v hodnocení datové kvality |
---|---|
Autor(ka) práce: | Sládek, David |
Typ práce: | Diplomová práce |
Vedoucí práce: | Sobíšek, Lukáš |
Oponenti práce: | Šulc, Zdeněk |
Jazyk práce: | Česky |
Abstrakt: | Tato diplomová práce se zaměřuje na problematiku kvantifikace datové kvality. Datová kvalita je téma, na který by měl být brán ohled před jakýmkoli statistickým výzkumem, neboť analýzy vystavené nad nepřesnými, zkreslenými, nebo neúplnými daty nemusejí podávat zobecnitelné závěry. K tomuto účelu je pro rychlé vyhodnocení datové kvality datové sady navržen princip měření pomocí takzvaného indexu datové kvality (DQI).Druhá část práce se zaměřuje na praktické využití DQI v registru pacientů s roztroušenou sklerózou (ReMuS) a tvorbě uživatelské aplikace, která umožňuje vyhodnocení DQI širší veřejnosti. |
Klíčová slova: | roztroušená skleróza; datová kvalita; index datové kvality; R; Shiny |
Název práce: | Use of statistical methods in data quality evaluation |
---|---|
Autor(ka) práce: | Sládek, David |
Typ práce: | Diploma thesis |
Vedoucí práce: | Sobíšek, Lukáš |
Oponenti práce: | Šulc, Zdeněk |
Jazyk práce: | Česky |
Abstrakt: | This diploma thesis focuses on data quality quantification. Data quality is a topic that should be considered before any statistical research, as analyzes exposed to inaccurate, biased or incomplete data do not have to provide generalizable conclusions. For this purpose, the principle of measurement using the so-called data quality index (DQI) is designed to quickly evaluate the data quality of the data-set.The second part of the thesis focuses on the practical use of DQI in the registry of patients with multiple sclerosis (ReMuS) and the creation of a an application that enables the evaluation of DQI to the general public. |
Klíčová slova: | data quality; multiple sclerosis; data quality index; R; Shiny |
Informace o studiu
Studijní program / obor: | Kvantitativní metody v ekonomice/Statistika |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 11. 6. 2018 |
---|---|
Datum podání práce: | 4. 5. 2020 |
Datum obhajoby: | 9. 6. 2020 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/66157/podrobnosti |