Využití velkých jazykových modelů pro interaktivní chatbotové aplikace

Název práce: Usage of Large Language Models for Interactive Chatbot Applications
Autor(ka) práce: Remešová, Kateřina
Typ práce: Diploma thesis
Vedoucí práce: Zamazal, Ondřej
Oponenti práce: Vencovský, Filip
Jazyk práce: English
Abstrakt:
The integration of Large Language Models (LLMs) into chatbot systems has shifted the human-machine interaction from rule-based programming to natural language communication. This thesis explores the current state of conversational AI systems and their performance on different data access tiers – static public data, dynamic public data, and private data and evaluates its performance across three distinct data access tiers: static public data, dynamic public data, and private data. For each tier, a dedicated chatbot application is developed, focusing on question answering and constraint-based generation tasks using prompt engineering techniques. Furthermore, it establishes an automatic evaluation pipeline that evaluates and compares the chatbot applications across multiple models. The evaluation demonstrates that the LLM-based chatbots perform more reliably on constraint-based generation tasks than in open-ended question answering, particularly when accessing external data sources. The findings highlight the importance of clear prompt structuring, retrieval strategies and model testing to enhance chatbot accuracy across varying data access tiers.
Klíčová slova: AI; chatbot; LLM; transformer architecture
Název práce: Využití velkých jazykových modelů pro interaktivní chatbotové aplikace
Autor(ka) práce: Remešová, Kateřina
Typ práce: Diplomová práce
Vedoucí práce: Zamazal, Ondřej
Oponenti práce: Vencovský, Filip
Jazyk práce: English
Abstrakt:
Zavedení velkých jazykových modelů (LLMs) do chatbotových systémů posunulo interakci mezi člověkem a strojem od programování založeného na pravidlech ke komunikaci v přirozeném jazyce. Tato práce zkoumá současný stav konverzačních AI systémů a jejich výkonnost na různých úrovních přístupu k datům – statická veřejná data, dynamická veřejná data a soukromá data. Pro každou z těchto úrovní je vyvinuta samostatná chatbotová aplikace, zaměřená na zodpovídání otázek a generování výstupů na základě omezení pomocí technik prompt engineeringu. Dále je navržen automatický evaluační systém, který porovnává výkon těchto chatbotových aplikací na různých modelech. Evaluace ukazuje, že chatboti na bázi LLM dosahují lepších výkonů na úlohách generování výstupů na základě omezení než na generování odpovědí na otevřené otázky, obzvlášť při napojení chatbota na externí datové zdroje. Výsledky ukazují význam jasného strukturování promptů, efektivních retrieval strategií a důkladného testování modelů pro zvýšení přesnosti chatbotů napříč různými úrovněmi přístupu k datům.
Klíčová slova: AI; chatbot; LLM; transformer architektura

Informace o studiu

Studijní program / obor: Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 1. 11. 2024
Datum podání práce: 4. 5. 2025
Datum obhajoby: 12. 6. 2025
Identifikátor v systému InSIS: https://insis.vse.cz/zp/90212/podrobnosti

Soubory ke stažení

    Poslední aktualizace: