Development of a RAG-Driven Chatbot for Transparent and Efficient Access to Enterprise Data

Thesis title: Development of a RAG-Driven Chatbot for Transparent and Efficient Access to Enterprise Data
Author: Sorokin, Artem
Thesis type: Diploma thesis
Supervisor: Vencovský, Filip
Opponents: Lyalin, Valeriy
Thesis language: English
Abstract:
In the context of the exponential growth of corporate data, traditional keyword-based information search methods prove insufficiently effective, leading to time costs and reduced employee productivity. This work is dedicated to the development and implementation of an intelligent chatbot based on the Retrieval-Augmented Generation (RAG) architecture to optimize access to corporate data within the Dawiso system. The proposed solution allows users to formulate queries in natural language and receive relevant answers with links to data sources, increasing the speed of access to information and ensuring the transparency of results. The work details the design, technical implementation, optimization (including dialogue management and hybrid search), and effectiveness evaluation of the chatbot. Testing results demonstrate the achievement of the set goals for providing fast and accurate access to information, integration with corporate applications, and increasing user satisfaction. The work confirms the viability of the RAG architecture in a corporate environment and outlines paths for further system development, including the implementation of an agentic approach and integration with graph data structures.
Keywords: Large Language Models (LLM); Information Retrieval; Knowledge Management; Chatbot; Retrieval-Augmented Generation (RAG); Natural Language Processing (NLP); Dawiso; Corporate Data
Thesis title: Vývoj chatbotu využívajícího architekturu RAG pro transparentní a efektivní přístup k firemním datům
Author: Sorokin, Artem
Thesis type: Diplomová práce
Supervisor: Vencovský, Filip
Opponents: Lyalin, Valeriy
Thesis language: English
Abstract:
V kontextu exponenciálního růstu firemních dat se tradiční metody vyhledávání informací založené na klíčových slovech ukazují jako nedostatečně efektivní, což vede ke ztrátám času a snížení produktivity zaměstnanců. Tato práce je věnována vývoji a implementaci inteligentního chatbotu založeného na architektuře Retrieval-Augmented Generation (RAG) za účelem optimalizace přístupu k firemním datům v systému Dawiso. Navrhované řešení umožňuje uživatelům formulovat dotazy v přirozeném jazyce a získávat relevantní odpovědi s odkazy na datové zdroje, čímž se zvyšuje rychlost přístupu k informacím a zajišťuje transparentnost výsledků. Práce podrobně popisuje návrh, technickou realizaci, optimalizaci (včetně řízení dialogu a hybridního vyhledávání) a hodnocení efektivity chatbotu. Výsledky testování potvrzují splnění stanovených cílů v oblasti rychlého a přesného přístupu k informacím, integrace s firemními aplikacemi a zvýšení spokojenosti uživatelů. Práce potvrzuje životaschopnost architektury RAG ve firemním prostředí a naznačuje možnosti dalšího rozvoje systému, včetně implementace agentního přístupu a integrace s grafovými datovými strukturami.
Keywords: Chatbot; Firemní data; Vyhledávání informací; Retrieval-Augmented Generation (RAG); Zpracování přirozeného jazyka (NLP); Velké jazykové modely (LLM); Správa znalostí; Dawiso

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 1. 11. 2024
Date of submission: 5. 5. 2025
Date of defense: 2025

Files for download

The files will be available after the defense of the thesis.

    Last update: