Thesis title: |
Využití LLMs pro vysvětlitelnou klasifikaci obrazu z oblasti biomedicíny |
Author: |
Ay, Michael Ahmet |
Thesis type: |
Bakalářská práce |
Supervisor: |
Kliegr, Tomáš |
Opponents: |
Cihlo, Miroslav |
Thesis language: |
Česky |
Abstract: |
Bakalářská práce se zabývá využitím velkých jazykových modelů (LLMs) při vysvětlitelné klasifikaci biomedicínských obrazových dat. Navržený systém generuje textové popisy z rentgenových snímků horní končetiny pomocí dvou typů jazykových výstupů: přirozeně formulovaných frází a segmentovaných výstupů vzniklých slovním rozkladem. Každý popis je následně převeden do prostoru vnoření a dále zpracován pomocí čtyř pooling strategií a rozšířen o doménové příznaky. Na takto získaných vstupech jsou trénovány vysvětlitelné klasifikátory. Výsledky ukazují, že nejvyšších hodnot metriky úplnost dosáhla logistická regrese využívající segmentované výstupy generované modelem Qwen 2.5-VL-7B-Instruct a Bio_ClinicalBERT ve spojení s kombinovanou pooling strategií a doménovými příznaky. Tato konfigurace dosáhla úplnosti 0,696. Přestože tento výsledek nepřekonal obrazový klasifikátor ResNet-34, který dosáhl úplnosti 0,818, nabídla vnořená reprezentace konkurenceschopný výkon při zachování vysvětlitelnosti vstupních dat. Nejlepšího výsledku v rámci přirozeně formulovaných frází bylo rovněž dosaženo pomocí logistické regrese, konkrétně při využití GPT-4o-mini od OpenAI s text-embedding-3-small a Max pooling, s úplností 0,604. Práce dále analyzuje jazykové výstupy, vliv pooling strategií a význam doménových příznaků. Celý systém je implementován jako reprodukovatelný a snadno rozšiřitelný postup, který umožňuje další aplikace v oblasti biomedicínské klasifikace. |
Keywords: |
velké jazykové modely; klasifikace; vysvětlitelná umělá inteligence; interpretovatelnost; biomedicínská obrazová data; rentgen; vnoření |
Thesis title: |
Explainable Biomedical Image Classification Using Large Language Models |
Author: |
Ay, Michael Ahmet |
Thesis type: |
Bachelor thesis |
Supervisor: |
Kliegr, Tomáš |
Opponents: |
Cihlo, Miroslav |
Thesis language: |
Česky |
Abstract: |
Bachelor thesis explores the use of large language models (LLMs) for explainable classification of biomedical image data. The proposed system generates textual descriptions from upper-limb X-ray images using two types of language outputs: diagnostic phrases and segmented outputs obtained through word-level decomposition. Each description is subsequently transformed into an embedding representation, processed using four pooling strategies, and enriched with domain-specific features. These representations serve as input for interpretable classifiers. The results show that the highest recall was achieved by a logistic regression model using segmented outputs generated by Qwen 2.5-VL-7B-Instruct and embedded with Bio_ClinicalBERT, combined with a composite pooling strategy and domain features. This configuration reached a recall of 0.696. Although it did not outperform the image-based classifier ResNet-34, which achieved a recall of 0.818, the embedding-based representation provided competitive performance while preserving interpretability. The best result for diagnostic phrase descriptions was also achieved by logistic regression, using GPT-4o-mini by OpenAI with the text-embedding-3-small model and Max pooling, reaching a recall of 0.604. The thesis further analyzes the language outputs, the influence of pooling strategies, and the role of domain-specific features. The entire system is implemented as a reproducible and |
Keywords: |
large language models; biomedical image data; X-ray images; explainable artificial intelligence; classification; interpretability; embeddings |
Information about study
Study programme: |
Aplikovaná informatika |
Type of study programme: |
Bakalářský studijní program |
Assigned degree: |
Bc. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: |
10. 12. 2024 |
Date of submission: |
12. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.