Využití LLMs pro vysvětlitelnou klasifikaci obrazu z oblasti biomedicíny

Česky
English

Název práce:	Využití LLMs pro vysvětlitelnou klasifikaci obrazu z oblasti biomedicíny
Autor(ka) práce:	Ay, Michael Ahmet
Typ práce:	Bakalářská práce
Vedoucí práce:	Kliegr, Tomáš
Oponenti práce:	Cihlo, Miroslav
Jazyk práce:	Česky
Abstrakt:	Bakalářská práce se zabývá využitím velkých jazykových modelů (LLMs) při vysvětlitelné klasifikaci biomedicínských obrazových dat. Navržený systém generuje textové popisy z rentgenových snímků horní končetiny pomocí dvou typů jazykových výstupů: přirozeně formulovaných frází a segmentovaných výstupů vzniklých slovním rozkladem. Každý popis je následně převeden do prostoru vnoření a dále zpracován pomocí čtyř pooling strategií a rozšířen o doménové příznaky. Na takto získaných vstupech jsou trénovány vysvětlitelné klasifikátory. Výsledky ukazují, že nejvyšších hodnot metriky úplnost dosáhla logistická regrese využívající segmentované výstupy generované modelem Qwen 2.5-VL-7B-Instruct a Bio_ClinicalBERT ve spojení s kombinovanou pooling strategií a doménovými příznaky. Tato konfigurace dosáhla úplnosti 0,696. Přestože tento výsledek nepřekonal obrazový klasifikátor ResNet-34, který dosáhl úplnosti 0,818, nabídla vnořená reprezentace konkurenceschopný výkon při zachování vysvětlitelnosti vstupních dat. Nejlepšího výsledku v rámci přirozeně formulovaných frází bylo rovněž dosaženo pomocí logistické regrese, konkrétně při využití GPT-4o-mini od OpenAI s text-embedding-3-small a Max pooling, s úplností 0,604. Práce dále analyzuje jazykové výstupy, vliv pooling strategií a význam doménových příznaků. Celý systém je implementován jako reprodukovatelný a snadno rozšiřitelný postup, který umožňuje další aplikace v oblasti biomedicínské klasifikace.
Klíčová slova:	velké jazykové modely; klasifikace; vysvětlitelná umělá inteligence; interpretovatelnost; biomedicínská obrazová data; rentgen; vnoření

Název práce:	Explainable Biomedical Image Classification Using Large Language Models
Autor(ka) práce:	Ay, Michael Ahmet
Typ práce:	Bachelor thesis
Vedoucí práce:	Kliegr, Tomáš
Oponenti práce:	Cihlo, Miroslav
Jazyk práce:	Česky
Abstrakt:	Bachelor thesis explores the use of large language models (LLMs) for explainable classification of biomedical image data. The proposed system generates textual descriptions from upper-limb X-ray images using two types of language outputs: diagnostic phrases and segmented outputs obtained through word-level decomposition. Each description is subsequently transformed into an embedding representation, processed using four pooling strategies, and enriched with domain-specific features. These representations serve as input for interpretable classifiers. The results show that the highest recall was achieved by a logistic regression model using segmented outputs generated by Qwen 2.5-VL-7B-Instruct and embedded with Bio_ClinicalBERT, combined with a composite pooling strategy and domain features. This configuration reached a recall of 0.696. Although it did not outperform the image-based classifier ResNet-34, which achieved a recall of 0.818, the embedding-based representation provided competitive performance while preserving interpretability. The best result for diagnostic phrase descriptions was also achieved by logistic regression, using GPT-4o-mini by OpenAI with the text-embedding-3-small model and Max pooling, reaching a recall of 0.604. The thesis further analyzes the language outputs, the influence of pooling strategies, and the role of domain-specific features. The entire system is implemented as a reproducible and
Klíčová slova:	large language models; biomedical image data; X-ray images; explainable artificial intelligence; classification; interpretability; embeddings

Informace o studiu

Studijní program / obor:	Aplikovaná informatika
Typ studijního programu:	Bakalářský studijní program
Přidělovaná hodnost:	Bc.
Instituce přidělující hodnost:	Vysoká škola ekonomická v Praze
Fakulta:	Fakulta informatiky a statistiky
Katedra:	Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce:	10. 12. 2024
Datum podání práce:	12. 5. 2025
Datum obhajoby:	26. 6. 2025
Identifikátor v systému InSIS:	https://insis.vse.cz/zp/90716/podrobnosti

Soubory ke stažení

Hlavní práce
90716_aymi00.pdf, 8.3 MB Stáhnout

Veřejná příloha
31479_aymi00.unknown, 5 kB Stáhnout

Veřejná příloha
31480_aymi00.unknown, 184.1 kB Stáhnout

Veřejná příloha
31482_aymi00.csv, 26.8 kB Stáhnout

Veřejná příloha
31483_aymi00.csv, 107.6 kB Stáhnout

Veřejná příloha
31484_aymi00.unknown, 7 MB Stáhnout

Veřejná příloha
31485_aymi00.unknown, 8.4 MB Stáhnout

Veřejná příloha
31486_aymi00.unknown, 36.6 kB Stáhnout

Veřejná příloha
31487_aymi00.unknown, 6.7 MB Stáhnout

Veřejná příloha
31488_aymi00.unknown, 7.9 MB Stáhnout

Veřejná příloha
31489_aymi00.unknown, 1.8 MB Stáhnout

Veřejná příloha
31494_aymi00.unknown, 40.6 kB Stáhnout

Oponentura
86176_Cihlo.pdf, 109.7 kB Stáhnout

Hodnocení vedoucího
90716_klit01.pdf, 112.5 kB Stáhnout