Využití LLMs pro vysvětlitelnou klasifikaci obrazu z oblasti biomedicíny
Název práce: | Využití LLMs pro vysvětlitelnou klasifikaci obrazu z oblasti biomedicíny |
---|---|
Autor(ka) práce: | Ay, Michael Ahmet |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Kliegr, Tomáš |
Oponenti práce: | Cihlo, Miroslav |
Jazyk práce: | Česky |
Abstrakt: | Bakalářská práce se zabývá využitím velkých jazykových modelů (LLMs) při vysvětlitelné klasifikaci biomedicínských obrazových dat. Navržený systém generuje textové popisy z rentgenových snímků horní končetiny pomocí dvou typů jazykových výstupů: přirozeně formulovaných frází a segmentovaných výstupů vzniklých slovním rozkladem. Každý popis je následně převeden do prostoru vnoření a dále zpracován pomocí čtyř pooling strategií a rozšířen o doménové příznaky. Na takto získaných vstupech jsou trénovány vysvětlitelné klasifikátory. Výsledky ukazují, že nejvyšších hodnot metriky úplnost dosáhla logistická regrese využívající segmentované výstupy generované modelem Qwen 2.5-VL-7B-Instruct a Bio_ClinicalBERT ve spojení s kombinovanou pooling strategií a doménovými příznaky. Tato konfigurace dosáhla úplnosti 0,696. Přestože tento výsledek nepřekonal obrazový klasifikátor ResNet-34, který dosáhl úplnosti 0,818, nabídla vnořená reprezentace konkurenceschopný výkon při zachování vysvětlitelnosti vstupních dat. Nejlepšího výsledku v rámci přirozeně formulovaných frází bylo rovněž dosaženo pomocí logistické regrese, konkrétně při využití GPT-4o-mini od OpenAI s text-embedding-3-small a Max pooling, s úplností 0,604. Práce dále analyzuje jazykové výstupy, vliv pooling strategií a význam doménových příznaků. Celý systém je implementován jako reprodukovatelný a snadno rozšiřitelný postup, který umožňuje další aplikace v oblasti biomedicínské klasifikace. |
Klíčová slova: | velké jazykové modely; klasifikace; vysvětlitelná umělá inteligence; interpretovatelnost; biomedicínská obrazová data; rentgen; vnoření |
Název práce: | Explainable Biomedical Image Classification Using Large Language Models |
---|---|
Autor(ka) práce: | Ay, Michael Ahmet |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Kliegr, Tomáš |
Oponenti práce: | Cihlo, Miroslav |
Jazyk práce: | Česky |
Abstrakt: | Bachelor thesis explores the use of large language models (LLMs) for explainable classification of biomedical image data. The proposed system generates textual descriptions from upper-limb X-ray images using two types of language outputs: diagnostic phrases and segmented outputs obtained through word-level decomposition. Each description is subsequently transformed into an embedding representation, processed using four pooling strategies, and enriched with domain-specific features. These representations serve as input for interpretable classifiers. The results show that the highest recall was achieved by a logistic regression model using segmented outputs generated by Qwen 2.5-VL-7B-Instruct and embedded with Bio_ClinicalBERT, combined with a composite pooling strategy and domain features. This configuration reached a recall of 0.696. Although it did not outperform the image-based classifier ResNet-34, which achieved a recall of 0.818, the embedding-based representation provided competitive performance while preserving interpretability. The best result for diagnostic phrase descriptions was also achieved by logistic regression, using GPT-4o-mini by OpenAI with the text-embedding-3-small model and Max pooling, reaching a recall of 0.604. The thesis further analyzes the language outputs, the influence of pooling strategies, and the role of domain-specific features. The entire system is implemented as a reproducible and |
Klíčová slova: | large language models; biomedical image data; X-ray images; explainable artificial intelligence; classification; interpretability; embeddings |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 10. 12. 2024 |
---|---|
Datum podání práce: | 12. 5. 2025 |
Datum obhajoby: | 26. 6. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/90716/podrobnosti |