Inovace velkých jazykových modelů (LLM) pomocí doladěné metody Retrieval-Augmented Generation (RAG): Návrh a vyhodnocení

Název práce: Innovating Large Language Models (LLMs) with Fine-Tuned Retrieval-Augmented Generation (RAG): Design and Evaluation
Autor(ka) práce: Pivoda, Šimon
Typ práce: Bachelor thesis
Vedoucí práce: Novák, Richard Antonín
Oponenti práce: Korčák, Jiří
Jazyk práce: English
Abstrakt:
Artificial intelligence (AI) is reshaping the way organizations manage and interact with information. Its influence is visible not only in daily operations but also in critical strategic decision-making. In recent years, an innovative approach known as Retrieval-Augmented Generation (RAG) has emerged, extending the capabilities of large language models (LLMs) by providing access to relevant and up-to-date data sources. This enables companies to better leverage their internal knowledge in real time and apply AI across a wide range of use cases. However, despite the fast advancements in large language models, their direct deployment within corporate environments often faces major challenges. Main among these are concerns related to data security and the risk of data leakage. As a result, many organizations are hesitant to expose sensitive internal data to language models. Additionally, LLMs often suffer from response accuracy issues, including the generation of incorrect or hallucinated responses when lacking domain-specific knowledge. The RAG method capably furnishes resolutions for these challenges. Safe as well as governed admittance to internal information that is stored within specialized repositories known as vector databases is permitted instead of mainly depending on closed training datasets. This approach greatly curtails the risk regarding data breaches and inaccuracies. This paper digs into the basic tenets and salient constituents of the RAG architecture. Many efficacious document segmentation and retrieval strategies are implemented via vector databases and embeddings. In the practical part of this thesis, a complex RAG system is proposed and tested, targeting automotive data. A PostgreSQL database enhanced with vector search support (PGVector) is used to store and manage vector representations. The primary data source is the large dataset from the Kaggle platform. System evaluation is conducted using a combination of expert queries and ground truth. The evaluation aims to assess the system’s accuracy, output validation, and its ability to minimize hallucinations. The results indicate that the RAG-based architecture is effective in enhancing conversational systems with internal data sources, resulting in more accurate responses, increased reliability, and a notable reduction in hallucinated or fabricated content.
Klíčová slova: model evaluation; prompt engineering; embedding; LLM; RAG; retriever; AI; context data; Generative AI
Název práce: Inovace velkých jazykových modelů (LLM) pomocí doladěné metody Retrieval-Augmented Generation (RAG): Návrh a vyhodnocení
Autor(ka) práce: Pivoda, Šimon
Typ práce: Bakalářská práce
Vedoucí práce: Novák, Richard Antonín
Oponenti práce: Korčák, Jiří
Jazyk práce: English
Abstrakt:
Umělá inteligence (AI) zásadně mění způsob, jakým organizace spravují a využívají informace. Její vliv je patrný nejen v každodenním provozu, ale i při strategickém rozhodování na nejvyšší úrovni. V posledních letech se objevila inovativní metoda zvaná Retrieval-Augmented Generation (RAG), která rozšiřuje schopnosti velkých jazykových modelů (LLM) tím, že jim umožňuje přístup k relevantním a aktuálním datovým zdrojům. Díky tomu mohou firmy efektivněji využívat své interní znalosti v reálném čase a aplikovat tak umělou inteligenci v široké škále scénářů. Přímé nasazení velkých jazykových modelů v podnikových prostředích však naráží na několik zásadních překážek. Hlavními z nich jsou obavy o bezpečnost dat a riziko jejich úniku. Mnohé organizace proto váhají svěřit citlivá interní data těmto modelům. Další výzvou je přesnost odpovědí – jazykové modely často generují nesprávné nebo smyšlené informace, zejména pokud postrádají specifické znalosti z dané domény. Metoda RAG přináší účinná řešení těchto problémů. Místo spoléhání se na uzavřené tréninkové datasety umožňuje bezpečný a řízený přístup k interním informacím uloženým ve specializovaných úložištích zvaných vektorové databáze. Tímto způsobem dochází k výraznému snížení rizika úniku dat i chyb v odpovědích. Tato práce se zaměřuje na základní principy a klíčové komponenty architektury RAG, včetně efektivních strategií segmentace dokumentů a vyhledávání prostřednictvím vektorových databází a embeddingů. V praktické části této bakalářské práce je navržen a otestován komplexní systém RAG zaměřený na automobilová data. Pro ukládání a správu vektorových reprezentací je využita databáze PostgreSQL rozšířená o podporu vektorového vyhledávání (PGVector). Hlavním datovým zdrojem je rozsáhlý dataset z platformy Kaggle. Hodnocení systému probíhá pomocí kombinace expertních dotazů a referenční pravdy a zaměřuje se na přesnost výstupů, jejich ověřitelnost a schopnost minimalizovat halucinace. Výsledky ukazují, že architektura založená na RAG je efektivní při zvyšování přesnosti konverzačních systémů využívajících interní datové zdroje. Výsledkem jsou přesnější odpovědi, vyšší spolehlivost a výrazné omezení výskytu smyšleného obsahu.
Klíčová slova: kontextová data; retriever; vyhodnocování modelů; prompt engineering; AI; RAG; LLM; Generativní AI; embedding

Informace o studiu

Studijní program / obor: Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra systémové analýzy

Informace o odevzdání a obhajobě

Datum zadání práce: 20. 1. 2025
Datum podání práce: 12. 5. 2025
Datum obhajoby: 24. 6. 2025
Identifikátor v systému InSIS: https://insis.vse.cz/zp/91036/podrobnosti

Soubory ke stažení

    Poslední aktualizace: