Comparison of the potency of application KDD methods and statistical methods in the analysis of ADAMEK data
Thesis title: | Porovnání možností aplikace metod DZD a statistických metod při analýze dat ADAMEK |
---|---|
Author: | Líbal, Petr |
Thesis type: | Bakalářská práce |
Supervisor: | Rauch, Jan |
Opponents: | Berka, Petr |
Thesis language: | Česky |
Abstract: | Tato bakalářská práce se zabývá porovnáním asociačních pravidel a logistické regrese. Pro toto porovnání byly použity medicínská data Adámek. Byl zkoumán vztah mezi atributy patřící do skupiny Fyzické vyšetření a Obtíže. Obě metody jsou teoreticky popsány, je uvedena jejich návaznost na známější příbuzné oblasti -- v případě asociačních pravidel na analýzu nákupního košíku, v případě logistické regrese na regresi lineární. Před samotnou analýzou jsou atributy popsány základními statistikami a je graficky znázorněno rozložení hodnot. U obou metod probíhá analýza stejným způsobem. Nejdříve jsou zkoumány vztahy u jednotlivých obtíží, poté jsou zkoumány vztahy u obtíží obecně. Na závěr jsou výsledky obou metod srovnány. |
Keywords: | data Adámek; logistická regrese; asociační pravidla |
Thesis title: | Comparison of the potency of application KDD methods and statistical methods in the analysis of ADAMEK data |
---|---|
Author: | Líbal, Petr |
Thesis type: | Bachelor thesis |
Supervisor: | Rauch, Jan |
Opponents: | Berka, Petr |
Thesis language: | Česky |
Abstract: | This bachelor thesis compares association rules and logistic regression. For this comparison medical data Adamek have been used. The relationship between attributes belonging to a group of Physical examinations and Difficulty has been studied. Both methods are theoretically described, their connection with the related common areas is mentioned - the analysis of market basket in the case of association rules, linear regression in the case of logistic regression. Before the analysis attributes are described with basic statistics and the distribution of values is graphically illustrated. In both cases, analysis proceed the same way. First, the relationship of each difficulty is examined, then is examined relationship of difficulties in general. In conclusion, the results of both methods is compared. |
Keywords: | ADAMEK data; logistic regression; association rules |
Information about study
Study programme: | Aplikovaná informatika/Informatika |
---|---|
Type of study programme: | Bakalářský studijní program |
Assigned degree: | Bc. |
Institutions assigning academic degree: | Vysoká škola ekonomická v Praze |
Faculty: | Faculty of Informatics and Statistics |
Department: | Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: | 20. 2. 2009 |
---|---|
Date of submission: | 11. 5. 2009 |
Date of defense: | 4. 9. 2009 |
Identifier in the InSIS system: | https://insis.vse.cz/zp/19021/podrobnosti |