Explainable Biomedical Image Classification Using Large Language Models

Thesis title: Využití LLMs pro vysvětlitelnou klasifikaci obrazu z oblasti biomedicíny
Author: Ay, Michael Ahmet
Thesis type: Bakalářská práce
Supervisor: Kliegr, Tomáš
Opponents: Cihlo, Miroslav
Thesis language: Česky
Abstract:
Bakalářská práce se zabývá využitím velkých jazykových modelů (LLMs) při vysvětlitelné klasifikaci biomedicínských obrazových dat. Navržený systém generuje textové popisy z rentgenových snímků horní končetiny pomocí dvou typů jazykových výstupů: přirozeně formulovaných frází a segmentovaných výstupů vzniklých slovním rozkladem. Každý popis je následně převeden do prostoru vnoření a dále zpracován pomocí čtyř pooling strategií a rozšířen o doménové příznaky. Na takto získaných vstupech jsou trénovány vysvětlitelné klasifikátory. Výsledky ukazují, že nejvyšších hodnot metriky úplnost dosáhla logistická regrese využívající segmentované výstupy generované modelem Qwen 2.5-VL-7B-Instruct a Bio_ClinicalBERT ve spojení s kombinovanou pooling strategií a doménovými příznaky. Tato konfigurace dosáhla úplnosti 0,696. Přestože tento výsledek nepřekonal obrazový klasifikátor ResNet-34, který dosáhl úplnosti 0,818, nabídla vnořená reprezentace konkurenceschopný výkon při zachování vysvětlitelnosti vstupních dat. Nejlepšího výsledku v rámci přirozeně formulovaných frází bylo rovněž dosaženo pomocí logistické regrese, konkrétně při využití GPT-4o-mini od OpenAI s text-embedding-3-small a Max pooling, s úplností 0,604. Práce dále analyzuje jazykové výstupy, vliv pooling strategií a význam doménových příznaků. Celý systém je implementován jako reprodukovatelný a snadno rozšiřitelný postup, který umožňuje další aplikace v oblasti biomedicínské klasifikace.
Keywords: velké jazykové modely; klasifikace; vysvětlitelná umělá inteligence; interpretovatelnost; biomedicínská obrazová data; rentgen; vnoření
Thesis title: Explainable Biomedical Image Classification Using Large Language Models
Author: Ay, Michael Ahmet
Thesis type: Bachelor thesis
Supervisor: Kliegr, Tomáš
Opponents: Cihlo, Miroslav
Thesis language: Česky
Abstract:
Bachelor thesis explores the use of large language models (LLMs) for explainable classification of biomedical image data. The proposed system generates textual descriptions from upper-limb X-ray images using two types of language outputs: diagnostic phrases and segmented outputs obtained through word-level decomposition. Each description is subsequently transformed into an embedding representation, processed using four pooling strategies, and enriched with domain-specific features. These representations serve as input for interpretable classifiers. The results show that the highest recall was achieved by a logistic regression model using segmented outputs generated by Qwen 2.5-VL-7B-Instruct and embedded with Bio_ClinicalBERT, combined with a composite pooling strategy and domain features. This configuration reached a recall of 0.696. Although it did not outperform the image-based classifier ResNet-34, which achieved a recall of 0.818, the embedding-based representation provided competitive performance while preserving interpretability. The best result for diagnostic phrase descriptions was also achieved by logistic regression, using GPT-4o-mini by OpenAI with the text-embedding-3-small model and Max pooling, reaching a recall of 0.604. The thesis further analyzes the language outputs, the influence of pooling strategies, and the role of domain-specific features. The entire system is implemented as a reproducible and
Keywords: large language models; biomedical image data; X-ray images; explainable artificial intelligence; classification; interpretability; embeddings

Information about study

Study programme: Aplikovaná informatika
Type of study programme: Bakalářský studijní program
Assigned degree: Bc.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information and Knowledge Engineering

Information on submission and defense

Date of assignment: 10. 12. 2024
Date of submission: 12. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: