The Application of KDD Methods on Data from Electronic Receipts
Thesis title: | Aplikace metod dobývání znalostí z databází na data z elektronických přejímek |
---|---|
Author: | Kostrouchova, Veronika |
Thesis type: | Bakalářská práce |
Supervisor: | Rauch, Jan |
Opponents: | Máša, Petr |
Thesis language: | Česky |
Abstract: | Tato bakalářská práce se zabývá procesem dobývání znalostí z databází na reálných datech z prostředí lesního průmyslu. Předmětem analýz jsou data z elektronických přejímek z ledna roku 2021. Cílem práce je nalézt zajímavé vztahy skryté v datech, které mohou být přínosné pro majitele dat. Práce je rozdělená na teoretickou a praktickou část, první část práce popisuje použité metodiky dobývání znalostí z databází (DZD) od porozumění doménové oblasti, porozumění datům, přes rozsáhlý postup přípravy dat a pak k samotnému modelování a vyhodnocování výsledků. Praktická část práce postupuje dle popsané metodiky. V analýze se postupovalo v souladu s metodikou CRISP-DM a pro zodpovězení dvou analytických otázek byly využity procedury KL-Miner, CF-Miner a 4ft-Miner implementované v systému LISp-Miner. Výsledkem analýz bylo zjištění platnosti vztahu mezi tloušťkovým stupněm a kvalitou sortimentu a neplatnosti v případě výmětu s takzvaným odskokem. |
Keywords: | LISp-Miner; GUHA metoda; CRISP-DM; DZD; procedura 4ft-Miner; procedura CF-Miner; procedura KL-Miner; datová analýza |
Thesis title: | The Application of KDD Methods on Data from Electronic Receipts |
---|---|
Author: | Kostrouchova, Veronika |
Thesis type: | Bachelor thesis |
Supervisor: | Rauch, Jan |
Opponents: | Máša, Petr |
Thesis language: | Česky |
Abstract: | This bachelor thesis deals with the application of knowledge discovery in databases on real data from the forestry industry. The subject of the analysis is data from an electronic receipt from January 2021. The goal of this thesis is to find interesting, potentially usable patterns hidden in the analyzed data. This work is divided in two parts, the theoretical part, that describes the basic phases of knowledge discovery in databases (KDD) from business understanding, data comprehension, to data preparation, modelling and interpreting the results. The practical part of this study follows the basic phases of KDD in use as described in the theoretical part and presents the use of GUHA-procedures CF-Miner, KL-Miner a 4ft-Miner im LISp-Miner in answering two analytical questions proposed by the data´s owner. The outcome of the analyses was the confirmation of the relation between the diameter degree and quality and the invalidity between the reject goods and the so-called measured jump. |
Keywords: | GuHA method; CRISP-DM; KDD; LISp-Miner; 4ft-Miner procedure; CF-Miner procedure; KL-Miner procedure; data analysis |
Information about study
Study programme: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 26. 1. 2021 |
---|---|
Date of submission: | 10. 5. 2021 |
Date of defense: | 22. 6. 2021 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/75919/podrobnosti |