Aplikace metod dobývání znalostí z databází na data z elektronických přejímek

Název práce: Aplikace metod dobývání znalostí z databází na data z elektronických přejímek
Autor(ka) práce: Kostrouchova, Veronika
Typ práce: Bakalářská práce
Vedoucí práce: Rauch, Jan
Oponenti práce: Máša, Petr
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce se zabývá procesem dobývání znalostí z databází na reálných datech z prostředí lesního průmyslu. Předmětem analýz jsou data z elektronických přejímek z ledna roku 2021. Cílem práce je nalézt zajímavé vztahy skryté v datech, které mohou být přínosné pro majitele dat. Práce je rozdělená na teoretickou a praktickou část, první část práce popisuje použité metodiky dobývání znalostí z databází (DZD) od porozumění doménové oblasti, porozumění datům, přes rozsáhlý postup přípravy dat a pak k samotnému modelování a vyhodnocování výsledků. Praktická část práce postupuje dle popsané metodiky. V analýze se postupovalo v souladu s metodikou CRISP-DM a pro zodpovězení dvou analytických otázek byly využity procedury KL-Miner, CF-Miner a 4ft-Miner implementované v systému LISp-Miner. Výsledkem analýz bylo zjištění platnosti vztahu mezi tloušťkovým stupněm a kvalitou sortimentu a neplatnosti v případě výmětu s takzvaným odskokem.
Klíčová slova: LISp-Miner; GUHA metoda; CRISP-DM; DZD; procedura 4ft-Miner; procedura CF-Miner; procedura KL-Miner; datová analýza
Název práce: The Application of KDD Methods on Data from Electronic Receipts
Autor(ka) práce: Kostrouchova, Veronika
Typ práce: Bachelor thesis
Vedoucí práce: Rauch, Jan
Oponenti práce: Máša, Petr
Jazyk práce: Česky
Abstrakt:
This bachelor thesis deals with the application of knowledge discovery in databases on real data from the forestry industry. The subject of the analysis is data from an electronic receipt from January 2021. The goal of this thesis is to find interesting, potentially usable patterns hidden in the analyzed data. This work is divided in two parts, the theoretical part, that describes the basic phases of knowledge discovery in databases (KDD) from business understanding, data comprehension, to data preparation, modelling and interpreting the results. The practical part of this study follows the basic phases of KDD in use as described in the theoretical part and presents the use of GUHA-procedures CF-Miner, KL-Miner a 4ft-Miner im LISp-Miner in answering two analytical questions proposed by the data´s owner. The outcome of the analyses was the confirmation of the relation between the diameter degree and quality and the invalidity between the reject goods and the so-called measured jump.
Klíčová slova: GuHA method; CRISP-DM; KDD; LISp-Miner; 4ft-Miner procedure; CF-Miner procedure; KL-Miner procedure; data analysis

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 26. 1. 2021
Datum podání práce: 10. 5. 2021
Datum obhajoby: 22. 6. 2021
Identifikátor v systému InSIS: https://insis.vse.cz/zp/75919/podrobnosti

Soubory ke stažení

    Poslední aktualizace: