Analýza reálných dat - predikce hodnoty zákazníka

Název práce: Analýza reálných dat - predikce hodnoty zákazníka
Autor(ka) práce: Zíka, Libor
Typ práce: Bakalářská práce
Vedoucí práce: Chudán, David
Oponenti práce: Rauch, Jan
Jazyk práce: Česky
Abstrakt:
Cílem této bakalářské práce je pomocí analýzy reálných dat o klientech nalézt takové vztahy, které by byly přínosem pro zadavatele a majitele dat, resp. zadavatelskou firmu. Analýza bude prováděna podle metodiky CRISP-DM. Jako analytické techniky jsou zvoleny CF-Miner a ETree-Miner, které jsou součástí systému LISp-Miner. Práce je rozdělena na teoretickou a praktickou část. V rámci teoretické části se čtenář dozví, co je to proces dobývání znalostí z databází a jaké v této oblasti existují obecné postupy. Dále jsou popsány jednotlivé fáze procesu DZD podle zvolené metodiky. Na konci teoretické části je čtenář seznámen s akademickým systémem LISp-Miner sloužícím pro dobývání znalostí z databází, jež je založen na metodě GUHA. Následuje popis analytických procedur CF-Miner a ETree-Miner, které jsou v rámci analýzy používány. Praktická část je členěna podle metodiky CRISP-DM. Nejprve je představena oblast analýzy a data, se kterými se v analýze pracuje. Dále je popsána fáze přípravy dat, která předchází samotnému modelování. V rámci fáze modelování jsou řešeny jednotlivé analytické úlohy. Celý proces analýzy byl velmi časově náročný, zejména v oblasti přípravy dat. Data se však pro analýzu ukázala jako méně vhodná, a proto jsou v poslední kapitole doporučeny návrhy ke zlepšení.
Klíčová slova: CRISP-DM; LISp-Miner; CF-Miner; ETree-Miner; DZD; GUHA; data mining
Název práce: Customer Value Prediction - Real Clients' Data Analysis
Autor(ka) práce: Zíka, Libor
Typ práce: Bachelor thesis
Vedoucí práce: Chudán, David
Oponenti práce: Rauch, Jan
Jazyk práce: Česky
Abstrakt:
The aim of this bachelor's thesis is to find such relationships which would contribute to submitters and owners of data or a sponsoring company, all by using the real clients' data analysis. The analysis will be performed based on the CRISP-DM methodology. As for the analytical techniques, CF-Miner and ETree-Miner, which are the part of the LISp-Miner system, are used. The thesis is divided into two parts - theoretical and practical. In the theoretical part, we will learn about the process of the knowledge discovery in databases and what general processes exist. Further, there is the description of the particular phases of the KDD process with the respect to chosen methodology. At the end of this part, we will learn more about the academic system LISp-Miner which serves for the knowledge discovery in databases; this system is based on the GUHA method. Finally, there is the description of the analytical procedures CF-Miner and ETree-Miner which are being used in the analysis. The practical part is structured in compliance with the CRISP-DM methodology. At first, the scope of analysis and the data used in the analysis are introduced. Then there is the explanation of the phase of the data preparation, this phase precedes the simulation itself. In the scope of the simulation phase, the particular analytical tasks are being solved. The whole analysis process was very time demanding, mainly due to the data preparation. However, the data have appeared as less appropriate and thus there are suggestions for improvement listed in the last chapter.
Klíčová slova: data mining; KDD; GUHA; CRISP-DM; LISp-Miner; CF-Miner; ETree-Miner

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 14. 2. 2018
Datum podání práce: 2. 5. 2018
Datum obhajoby: 21. 6. 2018
Identifikátor v systému InSIS: https://insis.vse.cz/zp/64795/podrobnosti

Soubory ke stažení

    Poslední aktualizace: