Porovnatelnost dat v dobývání znalostí z databází
Název práce: | Porovnatelnost dat v dobývání znalostí z databází |
---|---|
Autor(ka) práce: | Horáková, Linda |
Typ práce: | Diplomová práce |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Svátek, Vojtěch |
Jazyk práce: | Česky |
Abstrakt: | Diplomová práce se zabývá analýzou porovnatelnosti a souměřitelnosti dat v datových souborech, nad kterými jsou prováděny úlohy dobývání znalostí z databází. Porovnatelnost dat je jedním z aspektů datové kvality, která je kritická pro získání správných a využitelných výsledků získaných metodami dolování dat.
Teoretická část se věnuje obecným principům datové kvality, porovnatelnosti a souměřitelnosti dat, a také procesu dobývání znalostí z databází a specifickým aspektům dolování agregovaných dat. Tyto poznatky jsou následně aplikovány v praktické části diplomové práce, jejímž cílem je navrhnout obecnou metodologii, která slouží k rozeznání potenciálních problémů v porovnatelnosti dat v rámci datového souboru. Tato metodologie vznikla na základě analýzy reálného souboru dat, obsahujícího údaje o prodejích. Následně je metodologie aplikována na údaje z oblasti veřejných rozpočtů, konkrétně na data z Evropského sociálního fondu. |
Klíčová slova: | kvalita dat; souměřitelnost; dobývání znalostí z databází; asociační pravidla; porovnatelnost; dolování dat |
Název práce: | Data comparability in knowledge discovery in databases |
---|---|
Autor(ka) práce: | Horáková, Linda |
Typ práce: | Diploma thesis |
Vedoucí práce: | Chudán, David |
Oponenti práce: | Svátek, Vojtěch |
Jazyk práce: | Česky |
Abstrakt: | The master thesis is focused on analysis of data comparability and commensurability in datasets, which are used for obtaining knowledge using methods of data mining. Data comparability is one of aspects of data quality, which is crucial for correct and applicable results from data mining tasks.
The aim of the theoretical part of the thesis is to briefly describe the field of knowledqe discovery and define specifics of mining of aggregated data. Moreover, the terms of comparability and commensurability is discussed. The main part is focused on process of knowledge discovery. These findings are applied in practical part of the thesis. The main goal of this part is to define general methodology, which can be used for discovery of potential problems of data comparability in analyzed data. This methodology is based on analysis of real dataset containing daily sales of products. In conclusion, the methodology is applied on data from the field of public budgets. |
Klíčová slova: | commensurability; data comparability; Knowledge Discovery in Databases; association rules; data quality; data mining |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Znalostní a webové technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 30. 1. 2017 |
---|---|
Datum podání práce: | 24. 4. 2017 |
Datum obhajoby: | 7. 6. 2017 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/60506/podrobnosti |