Praktické uplatnění technologií data mining ve zdravotních pojišťovnách

Název práce: Praktické uplatnění technologií data mining ve zdravotních pojišťovnách
Autor(ka) práce: Kulhavý, Lukáš
Typ práce: Diplomová práce
Vedoucí práce: Pour, Jan
Oponenti práce: Kučera, Petr
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se věnuje technologii data mining a možnostem jejího praktického využití v oblasti zdravotních pojišťoven. Práce vymezuje pojem data mining a jeho vztah k pojmu dobývání znalostí z databází. Pojem data mining je vysvětlen mimo jiné pomocí metodik popisujících jednotlivé fáze procesu dobývání znalostí z databází (CRISP-DM, SEMMA). Nechybí informace o možných praktických využitích technologie a o dostupných produktech na trhu (jak produkty zdarma dostupné, tak produkty komerční). Představení hlavních metod data miningu a konkrétních algoritmů (rozhodovací stromy, asociační pravidla, neuronové sítě a další metody) slouží jako teoretický úvod, na který navazují praktické aplikace nad reálnými daty reálných zdravotních pojišťoven. Jedná se o aplikace hledání příčin nárůstu úhrad a predikce odchodu zákazníků. Tyto aplikace jsem řešil ve zdarma dostupných systémech Weka a LISp-Miner. Cílem je představit a ověřit schopnosti data miningu nad daty tohoto typu a ověřit možnosti zmíněných systémů Weka a LISp-Miner při řešení úloh vzhledem k metodice CRISP-DM. Závěr práce je věnován oblastem cloud a grid computingu ve spojitosti s data miningem. Nabízí pohled na možnosti těchto technologií a jejich přínosy pro technologii data mining. Možnosti využití cloud computingu jsou prezentovány na řešení Amazon EC2, grid computing je možné využít z rozhraní Weka Experimenter.
Klíčová slova: grid computing; cloud computing; predikce odchodu zákazníků; Bayesovská klasifikace; asociační pravidla; CRISP-DM; dobývání znalostí z databází; data mining
Název práce: Practical applications of data mining technologies in health insurance companies
Autor(ka) práce: Kulhavý, Lukáš
Typ práce: Diploma thesis
Vedoucí práce: Pour, Jan
Oponenti práce: Kučera, Petr
Jazyk práce: Česky
Abstrakt:
This thesis focuses on data mining technology and its possible practical use in the field of health insurance companies. Thesis defines the term data mining and its relation to the term knowledge discovery in databases. The term data mining is explained, inter alia, with methods describing the individual phases of the process of knowledge discovery in databases (CRISP-DM, SEMMA). There is also information about possible practical applications, technologies and products available in the market (both products available free and commercial products). Introduction of the main data mining methods and specific algorithms (decision trees, association rules, neural networks and other methods) serves as a theoretical introduction, on which are the practical applications of real data in real health insurance companies build. These are applications seeking the causes of increased remittances and churn prediction. I have solved these applications in freely-available systems Weka and LISP-Miner. The objective is to introduce and to prove data mining capabilities over this type of data and to prove capabilities of Weka and LISP-Miner systems in solving tasks due to the methodology CRISP-DM. The last part of thesis is devoted the fields of cloud and grid computing in conjunction with data mining. It offers an insight into possibilities of these technologies and their benefits to the technology of data mining. Possibilities of cloud computing are presented on the Amazon EC2 system, grid computing can be used in Weka Experimenter interface.
Klíčová slova: grid computing; cloud computing; churn prediction; Bayesian classification; association rules; CRISP-DM; knowledge discovery in databases; data mining

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 18. 2. 2010
Datum podání práce: 30. 6. 2010
Datum obhajoby: 9. 2. 2011
Identifikátor v systému InSIS: https://insis.vse.cz/zp/24903/podrobnosti

Soubory ke stažení

    Poslední aktualizace: