Využití velkých jazykových modelů pro interaktivní chatbotové aplikace
Název práce: | Usage of Large Language Models for Interactive Chatbot Applications |
---|---|
Autor(ka) práce: | Remešová, Kateřina |
Typ práce: | Diploma thesis |
Vedoucí práce: | Zamazal, Ondřej |
Oponenti práce: | Vencovský, Filip |
Jazyk práce: | English |
Abstrakt: | The integration of Large Language Models (LLMs) into chatbot systems has shifted the human-machine interaction from rule-based programming to natural language communication. This thesis explores the current state of conversational AI systems and their performance on different data access tiers – static public data, dynamic public data, and private data and evaluates its performance across three distinct data access tiers: static public data, dynamic public data, and private data. For each tier, a dedicated chatbot application is developed, focusing on question answering and constraint-based generation tasks using prompt engineering techniques. Furthermore, it establishes an automatic evaluation pipeline that evaluates and compares the chatbot applications across multiple models. The evaluation demonstrates that the LLM-based chatbots perform more reliably on constraint-based generation tasks than in open-ended question answering, particularly when accessing external data sources. The findings highlight the importance of clear prompt structuring, retrieval strategies and model testing to enhance chatbot accuracy across varying data access tiers. |
Klíčová slova: | AI; chatbot; LLM; transformer architecture |
Název práce: | Využití velkých jazykových modelů pro interaktivní chatbotové aplikace |
---|---|
Autor(ka) práce: | Remešová, Kateřina |
Typ práce: | Diplomová práce |
Vedoucí práce: | Zamazal, Ondřej |
Oponenti práce: | Vencovský, Filip |
Jazyk práce: | English |
Abstrakt: | Zavedení velkých jazykových modelů (LLMs) do chatbotových systémů posunulo interakci mezi člověkem a strojem od programování založeného na pravidlech ke komunikaci v přirozeném jazyce. Tato práce zkoumá současný stav konverzačních AI systémů a jejich výkonnost na různých úrovních přístupu k datům – statická veřejná data, dynamická veřejná data a soukromá data. Pro každou z těchto úrovní je vyvinuta samostatná chatbotová aplikace, zaměřená na zodpovídání otázek a generování výstupů na základě omezení pomocí technik prompt engineeringu. Dále je navržen automatický evaluační systém, který porovnává výkon těchto chatbotových aplikací na různých modelech. Evaluace ukazuje, že chatboti na bázi LLM dosahují lepších výkonů na úlohách generování výstupů na základě omezení než na generování odpovědí na otevřené otázky, obzvlášť při napojení chatbota na externí datové zdroje. Výsledky ukazují význam jasného strukturování promptů, efektivních retrieval strategií a důkladného testování modelů pro zvýšení přesnosti chatbotů napříč různými úrovněmi přístupu k datům. |
Klíčová slova: | AI; chatbot; LLM; transformer architektura |
Informace o studiu
Studijní program / obor: | Znalostní a webové technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 1. 11. 2024 |
---|---|
Datum podání práce: | 4. 5. 2025 |
Datum obhajoby: | 12. 6. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/90212/podrobnosti |