The Application of KDD Methods on Data from Electronic Receipts

Thesis title: Aplikace metod dobývání znalostí z databází na data z elektronických přejímek
Author: Kostrouchova, Veronika
Thesis type: Bakalářská práce
Supervisor: Rauch, Jan
Opponents: Máša, Petr
Thesis language: Česky
Abstract:
Tato bakalářská práce se zabývá procesem dobývání znalostí z databází na reálných datech z prostředí lesního průmyslu. Předmětem analýz jsou data z elektronických přejímek z ledna roku 2021. Cílem práce je nalézt zajímavé vztahy skryté v datech, které mohou být přínosné pro majitele dat. Práce je rozdělená na teoretickou a praktickou část, první část práce popisuje použité metodiky dobývání znalostí z databází (DZD) od porozumění doménové oblasti, porozumění datům, přes rozsáhlý postup přípravy dat a pak k samotnému modelování a vyhodnocování výsledků. Praktická část práce postupuje dle popsané metodiky. V analýze se postupovalo v souladu s metodikou CRISP-DM a pro zodpovězení dvou analytických otázek byly využity procedury KL-Miner, CF-Miner a 4ft-Miner implementované v systému LISp-Miner. Výsledkem analýz bylo zjištění platnosti vztahu mezi tloušťkovým stupněm a kvalitou sortimentu a neplatnosti v případě výmětu s takzvaným odskokem.
Keywords: LISp-Miner; GUHA metoda; CRISP-DM; DZD; procedura 4ft-Miner; procedura CF-Miner; procedura KL-Miner; datová analýza
Thesis title: The Application of KDD Methods on Data from Electronic Receipts
Author: Kostrouchova, Veronika
Thesis type: Bachelor thesis
Supervisor: Rauch, Jan
Opponents: Máša, Petr
Thesis language: Česky
Abstract:
This bachelor thesis deals with the application of knowledge discovery in databases on real data from the forestry industry. The subject of the analysis is data from an electronic receipt from January 2021. The goal of this thesis is to find interesting, potentially usable patterns hidden in the analyzed data. This work is divided in two parts, the theoretical part, that describes the basic phases of knowledge discovery in databases (KDD) from business understanding, data comprehension, to data preparation, modelling and interpreting the results. The practical part of this study follows the basic phases of KDD in use as described in the theoretical part and presents the use of GUHA-procedures CF-Miner, KL-Miner a 4ft-Miner im LISp-Miner in answering two analytical questions proposed by the data´s owner. The outcome of the analyses was the confirmation of the relation between the diameter degree and quality and the invalidity between the reject goods and the so-called measured jump.
Keywords: GuHA method; CRISP-DM; KDD; LISp-Miner; 4ft-Miner procedure; CF-Miner procedure; KL-Miner procedure; data analysis

Information about study

Study programme: Aplikovaná informatika/Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 26. 1. 2021
Date of submission: 10. 5. 2021
Date of defense: 22. 6. 2021
Identifier in the InSIS system: https://insis.vse.cz/zp/75919/podrobnosti

Files for download

    Last update: