Aplikace systému LISp-Miner na data z databáze SEER

Název práce: Aplikace systému LISp-Miner na data z databáze SEER
Autor(ka) práce: Potanin, Alexandr
Typ práce: Diplomová práce
Vedoucí práce: Rauch, Jan
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá problematikou dobývání znalostí z databází s aplikací v medicínské doméně. Hlavním cílem práce je analýza rozsáhlého onkologického datasetu pocházejícího z amerického registru SEER (Surveillance, Epidemiology, and End Results) s využitím analytického systému LISp-Miner, který je založen na metodě GUHA. Celý analytický proces je strukturován podle uznávané metodiky CRISP-DM. Praktická část práce prezentuje dvanáct datově-analytických úloh řešených s využitím tří analytických procedur: 4ft-Miner, SD4ft-Miner a CF-Miner. Práce slouží jako metodická instrukce pro analýzu podobných datasetů. Dosažené výsledky nejen exaktně potvrzují platnost zavedených klinických standardů, ale především odhalují signifikantní sociodemografické disparity a vizualizují efektivitu preventivních screeningových programů.
Klíčová slova: KDD; GUHA; CRISP-DM; LISp-Miner; SEER
Název práce: Application of the LISp-Miner System to Data from the SEER Database
Autor(ka) práce: Potanin, Alexandr
Typ práce: Diploma thesis
Vedoucí práce: Rauch, Jan
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
This diploma thesis focuses on knowledge discovery in databases applied to the medical domain. The main objective is to analyze a large oncological dataset from the US SEER (Surveillance, Epidemiology, and End Results) database using the LISp-Miner system, which is based on the GUHA method. The entire analytical process is structured according to the recognized CRISP-DM methodology. The practical part of the thesis presents twelve data-analytical tasks solved using three procedures: 4ft-Miner, SD4ft-Miner, and CF-Miner. The thesis serves as a methodological guide for analyzing similar datasets. The achieved results not only exactingly validate established clinical standards but, more importantly, reveal significant sociodemographic disparities and visualize the effectiveness of preventive screening programs.
Klíčová slova: KDD; LISp-Miner; SEER; CRISP-DM; GUHA

Informace o studiu

Studijní program / obor: Podniková informatika
Typ studijního programu: Magisterský navazující studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 4. 6. 2025
Datum podání práce: 24. 6. 2026
Datum obhajoby: 2026

Soubory ke stažení

Soubory budou k dispozici až po obhajobě práce.

    Poslední aktualizace: