Comparison of the potency of application KDD methods and statistical methods in the analysis of ADAMEK data

Thesis title: Porovnání možností aplikace metod DZD a statistických metod při analýze dat ADAMEK
Author: Líbal, Petr
Thesis type: Bakalářská práce
Supervisor: Rauch, Jan
Opponents: Berka, Petr
Thesis language: Česky
Abstract:
Tato bakalářská práce se zabývá porovnáním asociačních pravidel a logistické regrese. Pro toto porovnání byly použity medicínská data Adámek. Byl zkoumán vztah mezi atributy patřící do skupiny Fyzické vyšetření a Obtíže. Obě metody jsou teoreticky popsány, je uvedena jejich návaznost na známější příbuzné oblasti -- v případě asociačních pravidel na analýzu nákupního košíku, v případě logistické regrese na regresi lineární. Před samotnou analýzou jsou atributy popsány základními statistikami a je graficky znázorněno rozložení hodnot. U obou metod probíhá analýza stejným způsobem. Nejdříve jsou zkoumány vztahy u jednotlivých obtíží, poté jsou zkoumány vztahy u obtíží obecně. Na závěr jsou výsledky obou metod srovnány.
Keywords: data Adámek; logistická regrese; asociační pravidla
Thesis title: Comparison of the potency of application KDD methods and statistical methods in the analysis of ADAMEK data
Author: Líbal, Petr
Thesis type: Bachelor thesis
Supervisor: Rauch, Jan
Opponents: Berka, Petr
Thesis language: Česky
Abstract:
This bachelor thesis compares association rules and logistic regression. For this comparison medical data Adamek have been used. The relationship between attributes belonging to a group of Physical examinations and Difficulty has been studied. Both methods are theoretically described, their connection with the related common areas is mentioned - the analysis of market basket in the case of association rules, linear regression in the case of logistic regression. Before the analysis attributes are described with basic statistics and the distribution of values is graphically illustrated. In both cases, analysis proceed the same way. First, the relationship of each difficulty is examined, then is examined relationship of difficulties in general. In conclusion, the results of both methods is compared.
Keywords: ADAMEK data; logistic regression; association rules

Information about study

Study programme: Aplikovaná informatika/Informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 20. 2. 2009
Date of submission: 11. 5. 2009
Date of defense: 4. 9. 2009
Identifier in the InSIS system: https://insis.vse.cz/zp/19021/podrobnosti

Files for download

    Last update: