Knowledge base, analytical questions, LISp-Mner system and ADAMEK data

Thesis title: Doménové znalosti, analytické otázky, systém LISp-Miner a data ADAMEK
Author: Kubín, Richard
Thesis type: Diplomová práce
Supervisor: Rauch, Jan
Opponents: Šimůnek, Milan
Thesis language: Česky
Abstract:
Tématem práce jsou kroky spojené s řešením analytické otázky pomocí systému LISp-Miner v medicínských datech Adámek. Kromě popisu postupu při aplikaci procedur 4ft-Miner a SD4ft-Miner na data Adámek, si práce klade za cíl všímat si možnosti budoucího zakomponování práce s formalizovanou doménovou znalostí, a připravit postup pro automatizaci prováděných kroků. Obsahem teoretické části je shrnutí základních pojmů a principů spojených s asociačními pravidly a metodou GUHA. Praktická část postupuje podle metodologie CRISP-DM. Výsledkem práce je postup, podle kterého je možné hledat zajímavá pravidla v jiných datech. Postup je dále aplikován na lékařská data STULONG pro získání podnětů pro jeho revizi. Použitá data se týkají kardiologických pacientů a pocházejí z EuroMISE.
Keywords: data mining; CRISP-DM; GUHA; analytická otázka; 4ft-Miner; SD4ft-Miner; ADAMEK; automatizace; doménové znalosti
Thesis title: Knowledge base, analytical questions, LISp-Mner system and ADAMEK data
Author: Kubín, Richard
Thesis type: Diploma thesis
Supervisor: Rauch, Jan
Opponents: Šimůnek, Milan
Thesis language: Česky
Abstract:
The steps associated with the analytical question solving in terms of LISp-Miner system in ADAMEK medical data are the theme of this thesis. The operating sequence of using 4ft-Miner and SD4ft-Miner procedures in ADAMEK data together with the possibility of further use of formalized background knowledge and preparing routing for automatization of the downrighted steps are the objectiv of this thesis. The summary of the basic concepts and axioms of association rules and GUHA method is the content of the theoretical part of the thesis. Operativ part starts from CRISP-DM methodology. The operating sequence enabling searching for interesting association rules in different data, that is applied on STULONG medical data afterwards in order to get instigations for it's revision, is the produce of this thesis. Used data that come from EuroMISE are concern with cardiological patients.
Keywords: data mining; CRISP-DM methodology; GUHA method; ADAMEK data; automatization; knowledge base; analytical question; SD4ft-Miner; 4ft-Miner

Information about study

Study programme: Aplikovaná informatika/Znalostní technologie
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 15. 5. 2009
Date of submission: 30. 6. 2009
Date of defense: 1. 2. 2010
Identifier in the InSIS system: https://insis.vse.cz/zp/20692/podrobnosti

Files for download

    Last update: