Practical applications of data mining technologies in health insurance companies

Thesis title: Praktické uplatnění technologií data mining ve zdravotních pojišťovnách
Author: Kulhavý, Lukáš
Thesis type: Diplomová práce
Supervisor: Pour, Jan
Opponents: Kučera, Petr
Thesis language: Česky
Abstract:
Tato diplomová práce se věnuje technologii data mining a možnostem jejího praktického využití v oblasti zdravotních pojišťoven. Práce vymezuje pojem data mining a jeho vztah k pojmu dobývání znalostí z databází. Pojem data mining je vysvětlen mimo jiné pomocí metodik popisujících jednotlivé fáze procesu dobývání znalostí z databází (CRISP-DM, SEMMA). Nechybí informace o možných praktických využitích technologie a o dostupných produktech na trhu (jak produkty zdarma dostupné, tak produkty komerční). Představení hlavních metod data miningu a konkrétních algoritmů (rozhodovací stromy, asociační pravidla, neuronové sítě a další metody) slouží jako teoretický úvod, na který navazují praktické aplikace nad reálnými daty reálných zdravotních pojišťoven. Jedná se o aplikace hledání příčin nárůstu úhrad a predikce odchodu zákazníků. Tyto aplikace jsem řešil ve zdarma dostupných systémech Weka a LISp-Miner. Cílem je představit a ověřit schopnosti data miningu nad daty tohoto typu a ověřit možnosti zmíněných systémů Weka a LISp-Miner při řešení úloh vzhledem k metodice CRISP-DM. Závěr práce je věnován oblastem cloud a grid computingu ve spojitosti s data miningem. Nabízí pohled na možnosti těchto technologií a jejich přínosy pro technologii data mining. Možnosti využití cloud computingu jsou prezentovány na řešení Amazon EC2, grid computing je možné využít z rozhraní Weka Experimenter.
Keywords: grid computing; cloud computing; predikce odchodu zákazníků; Bayesovská klasifikace; asociační pravidla; CRISP-DM; dobývání znalostí z databází; data mining
Thesis title: Practical applications of data mining technologies in health insurance companies
Author: Kulhavý, Lukáš
Thesis type: Diploma thesis
Supervisor: Pour, Jan
Opponents: Kučera, Petr
Thesis language: Česky
Abstract:
This thesis focuses on data mining technology and its possible practical use in the field of health insurance companies. Thesis defines the term data mining and its relation to the term knowledge discovery in databases. The term data mining is explained, inter alia, with methods describing the individual phases of the process of knowledge discovery in databases (CRISP-DM, SEMMA). There is also information about possible practical applications, technologies and products available in the market (both products available free and commercial products). Introduction of the main data mining methods and specific algorithms (decision trees, association rules, neural networks and other methods) serves as a theoretical introduction, on which are the practical applications of real data in real health insurance companies build. These are applications seeking the causes of increased remittances and churn prediction. I have solved these applications in freely-available systems Weka and LISP-Miner. The objective is to introduce and to prove data mining capabilities over this type of data and to prove capabilities of Weka and LISP-Miner systems in solving tasks due to the methodology CRISP-DM. The last part of thesis is devoted the fields of cloud and grid computing in conjunction with data mining. It offers an insight into possibilities of these technologies and their benefits to the technology of data mining. Possibilities of cloud computing are presented on the Amazon EC2 system, grid computing can be used in Weka Experimenter interface.
Keywords: grid computing; cloud computing; churn prediction; Bayesian classification; association rules; CRISP-DM; knowledge discovery in databases; data mining

Information about study

Study programme: Aplikovaná informatika/Informační systémy a technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 18. 2. 2010
Date of submission: 30. 6. 2010
Date of defense: 9. 2. 2011
Identifier in the InSIS system: https://insis.vse.cz/zp/24903/podrobnosti

Files for download

    Last update: