Explainable Biomedical Image Classification Using Large Language Models

Česky
English

Thesis title:	Využití LLMs pro vysvětlitelnou klasifikaci obrazu z oblasti biomedicíny
Author:	Ay, Michael Ahmet
Thesis type:	Bakalářská práce
Supervisor:	Kliegr, Tomáš
Opponents:	Cihlo, Miroslav
Thesis language:	Česky
Abstract:	Bakalářská práce se zabývá využitím velkých jazykových modelů (LLMs) při vysvětlitelné klasifikaci biomedicínských obrazových dat. Navržený systém generuje textové popisy z rentgenových snímků horní končetiny pomocí dvou typů jazykových výstupů: přirozeně formulovaných frází a segmentovaných výstupů vzniklých slovním rozkladem. Každý popis je následně převeden do prostoru vnoření a dále zpracován pomocí čtyř pooling strategií a rozšířen o doménové příznaky. Na takto získaných vstupech jsou trénovány vysvětlitelné klasifikátory. Výsledky ukazují, že nejvyšších hodnot metriky úplnost dosáhla logistická regrese využívající segmentované výstupy generované modelem Qwen 2.5-VL-7B-Instruct a Bio_ClinicalBERT ve spojení s kombinovanou pooling strategií a doménovými příznaky. Tato konfigurace dosáhla úplnosti 0,696. Přestože tento výsledek nepřekonal obrazový klasifikátor ResNet-34, který dosáhl úplnosti 0,818, nabídla vnořená reprezentace konkurenceschopný výkon při zachování vysvětlitelnosti vstupních dat. Nejlepšího výsledku v rámci přirozeně formulovaných frází bylo rovněž dosaženo pomocí logistické regrese, konkrétně při využití GPT-4o-mini od OpenAI s text-embedding-3-small a Max pooling, s úplností 0,604. Práce dále analyzuje jazykové výstupy, vliv pooling strategií a význam doménových příznaků. Celý systém je implementován jako reprodukovatelný a snadno rozšiřitelný postup, který umožňuje další aplikace v oblasti biomedicínské klasifikace.
Keywords:	velké jazykové modely; klasifikace; vysvětlitelná umělá inteligence; interpretovatelnost; biomedicínská obrazová data; rentgen; vnoření

Thesis title:	Explainable Biomedical Image Classification Using Large Language Models
Author:	Ay, Michael Ahmet
Thesis type:	Bachelor thesis
Supervisor:	Kliegr, Tomáš
Opponents:	Cihlo, Miroslav
Thesis language:	Česky
Abstract:	Bachelor thesis explores the use of large language models (LLMs) for explainable classification of biomedical image data. The proposed system generates textual descriptions from upper-limb X-ray images using two types of language outputs: diagnostic phrases and segmented outputs obtained through word-level decomposition. Each description is subsequently transformed into an embedding representation, processed using four pooling strategies, and enriched with domain-specific features. These representations serve as input for interpretable classifiers. The results show that the highest recall was achieved by a logistic regression model using segmented outputs generated by Qwen 2.5-VL-7B-Instruct and embedded with Bio_ClinicalBERT, combined with a composite pooling strategy and domain features. This configuration reached a recall of 0.696. Although it did not outperform the image-based classifier ResNet-34, which achieved a recall of 0.818, the embedding-based representation provided competitive performance while preserving interpretability. The best result for diagnostic phrase descriptions was also achieved by logistic regression, using GPT-4o-mini by OpenAI with the text-embedding-3-small model and Max pooling, reaching a recall of 0.604. The thesis further analyzes the language outputs, the influence of pooling strategies, and the role of domain-specific features. The entire system is implemented as a reproducible and
Keywords:	large language models; biomedical image data; X-ray images; explainable artificial intelligence; classification; interpretability; embeddings

Information about study

Study programme:	Aplikovaná informatika
Type of study programme:	Bakalářský studijní program
Assigned degree:	Bc.
Institutions assigning academic degree:	Vysoká škola ekonomická v Praze
Faculty:	Faculty of Informatics and Statistics
Department:	Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment:	10. 12. 2024
Date of submission:	12. 5. 2025
Date of defense:	26. 6. 2025
Identifier in the InSIS system:	https://insis.vse.cz/zp/90716/podrobnosti

Files for download

Main text
90716_aymi00.pdf, 8.3 MB Download

Public annex
31479_aymi00.unknown, 5 kB Download

Public annex
31480_aymi00.unknown, 184.1 kB Download

Public annex
31482_aymi00.csv, 26.8 kB Download

Public annex
31483_aymi00.csv, 107.6 kB Download

Public annex
31484_aymi00.unknown, 7 MB Download

Public annex
31485_aymi00.unknown, 8.4 MB Download

Public annex
31486_aymi00.unknown, 36.6 kB Download

Public annex
31487_aymi00.unknown, 6.7 MB Download

Public annex
31488_aymi00.unknown, 7.9 MB Download

Public annex
31489_aymi00.unknown, 1.8 MB Download

Public annex
31494_aymi00.unknown, 40.6 kB Download

Opponent's review
86176_Cihlo.pdf, 109.7 kB Download

Supervisor's review
90716_klit01.pdf, 112.5 kB Download