Analysis of real consumer loans data by LISp-Miner system
Thesis title: | Analýza reálných dat spotřebitelských úvěrů pomocí systému LISp-Miner |
---|---|
Author: | Rytych, Maxim |
Thesis type: | Bakalářská práce |
Supervisor: | Šimůnek, Milan |
Opponents: | Chudán, David |
Thesis language: | Česky |
Abstract: | Cílem této práce je nalézt v reálných datech spotřebitelských úvěrů zajímavé souvislosti, které by mohly být využity v praxi. Analýza dat je prováděna pomocí systému LISp-Miner, což je software určený pro dobývání znalostí z databází založený na metodě GUHA. Při analýze dat budou používány konkrétně procedury 4ft-Miner a SD4ft-Miner popsané dále. Použitá metodika je CRISP-DM. Přínos práce spočívá především v nalezení v datech neznámých nebo potvrzení známých souvislostí, které by mohly být prakticky využity. Dalšími přínosy jsou představení možností DZD a systému LISp-Miner. Práce je rozdělena na část teoretickou a praktickou. Ve třech kapitolách věnovaných teorii nejprve vysvětluji, co je dobývání znalostí z databází, kdy se objevuje, čím je zajímavé a jeho techniky s důrazem na použitá asociační pravidla. Poté popisuji stručně systém LISp-Miner a na umělých datech použité procedury. V poslední kapitole věnované teorii seznamuji čtenáře s metodikami používanými při dobývání znalostí z databází s důrazem na metodiku CRISP-DM, kterou jsem se rozhodl použít. Praktická část odpovídá jednotlivým krokům metodiky CRISP-DM, tj. porozumění problematice, porozumění datům, příprava dat, modelování, vyhodnocení a využití výsledků. Poslední dvě fáze jsem se rozhodl z důvodu přehlednosti spojit do jedné. |
Keywords: | procedura SD4ft-Miner; procedura 4ft-Miner; CRISP-DM; LISp-Miner; asociační pravidla; dobývání znalostí z databází |
Thesis title: | Analysis of real consumer loans data by LISp-Miner system |
---|---|
Author: | Rytych, Maxim |
Thesis type: | Bachelor thesis |
Supervisor: | Šimůnek, Milan |
Opponents: | Chudán, David |
Thesis language: | Česky |
Abstract: | The goal of this paper is to find interesting relations in real consumer loans data, which could be used practically. The analysis is done using LISp-Miner system which is a software designed for data discovery in databases based on the GUHA method. The analysis will use specifically 4ft-Miner and SD4ft-Miner procedures described below. The methodology used is CRISP-DM. The contribution of my work lies in finding unknown or confirming known relations in the field of consumer loans, which could be used practically. Further contribution lies in presentation of possibilities of data discovery in databases and the non-commercial LISp-Miner system. The bachelor thesis consists of a theoretical and a practical part. In the three chapters assigned for the theoretical part I explain at first, what is data discovery in databases, when it appears, why is it interesting and its techniques with an emphasis on the association rules used in this paper. Afterwards I briefly describe the LISp-Miner system and demonstrate the procedures used on artificial data. In the last theoretical chapter I introduce methodologies of data discovery in databases with an accent on CRISP-DM, which is the one used here. The practical part corresponds with the individual steps of the CRISP-DM metodology, i.e. business understanding, data understanding, data preparation, modeling, evaluation and deployment. Because of clarity I decided to join last two steps into one. |
Keywords: | SD4ft-Miner procedure; 4ft-Miner procedure; CRISP-DM; data discovery in databases; LISp-Miner; association rules |
Information about study
Study programme: | Aplikovaná informatika/Informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 30. 10. 2012 |
---|---|
Date of submission: | 10. 5. 2013 |
Date of defense: | 20. 6. 2013 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/40091/podrobnosti |