Porovnání možností aplikace metod DZD a statistických metod při analýze dat ADAMEK
Název práce: | Porovnání možností aplikace metod DZD a statistických metod při analýze dat ADAMEK |
---|---|
Autor(ka) práce: | Líbal, Petr |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Rauch, Jan |
Oponenti práce: | Berka, Petr |
Jazyk práce: | Česky |
Abstrakt: | Tato bakalářská práce se zabývá porovnáním asociačních pravidel a logistické regrese. Pro toto porovnání byly použity medicínská data Adámek. Byl zkoumán vztah mezi atributy patřící do skupiny Fyzické vyšetření a Obtíže. Obě metody jsou teoreticky popsány, je uvedena jejich návaznost na známější příbuzné oblasti -- v případě asociačních pravidel na analýzu nákupního košíku, v případě logistické regrese na regresi lineární. Před samotnou analýzou jsou atributy popsány základními statistikami a je graficky znázorněno rozložení hodnot. U obou metod probíhá analýza stejným způsobem. Nejdříve jsou zkoumány vztahy u jednotlivých obtíží, poté jsou zkoumány vztahy u obtíží obecně. Na závěr jsou výsledky obou metod srovnány. |
Klíčová slova: | data Adámek; logistická regrese; asociační pravidla |
Název práce: | Comparison of the potency of application KDD methods and statistical methods in the analysis of ADAMEK data |
---|---|
Autor(ka) práce: | Líbal, Petr |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Rauch, Jan |
Oponenti práce: | Berka, Petr |
Jazyk práce: | Česky |
Abstrakt: | This bachelor thesis compares association rules and logistic regression. For this comparison medical data Adamek have been used. The relationship between attributes belonging to a group of Physical examinations and Difficulty has been studied. Both methods are theoretically described, their connection with the related common areas is mentioned - the analysis of market basket in the case of association rules, linear regression in the case of logistic regression. Before the analysis attributes are described with basic statistics and the distribution of values is graphically illustrated. In both cases, analysis proceed the same way. First, the relationship of each difficulty is examined, then is examined relationship of difficulties in general. In conclusion, the results of both methods is compared. |
Klíčová slova: | ADAMEK data; logistic regression; association rules |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 20. 2. 2009 |
---|---|
Datum podání práce: | 11. 5. 2009 |
Datum obhajoby: | 4. 9. 2009 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/19021/podrobnosti |