Porovnatelnost dat v dobývání znalostí z databází

Název práce: Porovnatelnost dat v dobývání znalostí z databází
Autor(ka) práce: Horáková, Linda
Typ práce: Diplomová práce
Vedoucí práce: Chudán, David
Oponenti práce: Svátek, Vojtěch
Jazyk práce: Česky
Abstrakt:
Diplomová práce se zabývá analýzou porovnatelnosti a souměřitelnosti dat v datových souborech, nad kterými jsou prováděny úlohy dobývání znalostí z databází. Porovnatelnost dat je jedním z aspektů datové kvality, která je kritická pro získání správných a využitelných výsledků získaných metodami dolování dat. Teoretická část se věnuje obecným principům datové kvality, porovnatelnosti a souměřitelnosti dat, a také procesu dobývání znalostí z databází a specifickým aspektům dolování agregovaných dat. Tyto poznatky jsou následně aplikovány v praktické části diplomové práce, jejímž cílem je navrhnout obecnou metodologii, která slouží k rozeznání potenciálních problémů v porovnatelnosti dat v rámci datového souboru. Tato metodologie vznikla na základě analýzy reálného souboru dat, obsahujícího údaje o prodejích. Následně je metodologie aplikována na údaje z oblasti veřejných rozpočtů, konkrétně na data z Evropského sociálního fondu.
Klíčová slova: kvalita dat; souměřitelnost; dobývání znalostí z databází; asociační pravidla; porovnatelnost; dolování dat
Název práce: Data comparability in knowledge discovery in databases
Autor(ka) práce: Horáková, Linda
Typ práce: Diploma thesis
Vedoucí práce: Chudán, David
Oponenti práce: Svátek, Vojtěch
Jazyk práce: Česky
Abstrakt:
The master thesis is focused on analysis of data comparability and commensurability in datasets, which are used for obtaining knowledge using methods of data mining. Data comparability is one of aspects of data quality, which is crucial for correct and applicable results from data mining tasks. The aim of the theoretical part of the thesis is to briefly describe the field of knowledqe discovery and define specifics of mining of aggregated data. Moreover, the terms of comparability and commensurability is discussed. The main part is focused on process of knowledge discovery. These findings are applied in practical part of the thesis. The main goal of this part is to define general methodology, which can be used for discovery of potential problems of data comparability in analyzed data. This methodology is based on analysis of real dataset containing daily sales of products. In conclusion, the methodology is applied on data from the field of public budgets.
Klíčová slova: commensurability; data comparability; Knowledge Discovery in Databases; association rules; data quality; data mining

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 30. 1. 2017
Datum podání práce: 24. 4. 2017
Datum obhajoby: 7. 6. 2017
Identifikátor v systému InSIS: https://insis.vse.cz/zp/60506/podrobnosti

Soubory ke stažení

    Poslední aktualizace: