Application for Working with Private Structured Data Using LLM Tools

Thesis title: Aplikácia pre prácu s privátnymi štruktúrovanými dátami za použitia LLM nástrojov
Author: Lichvár, Peter
Thesis type: Diploma thesis
Supervisor: Sládek, Pavel
Opponents: Maryška, Miloš
Thesis language: Slovensky
Abstract:
Táto diplomová práca sa zaoberá návrhom a implementáciou aplikácie využívajúcej veľké jazykové modely (LLM) na bezpečnú a efektívnu interakciu s privátnymi CSV súbormi. Cieľom je vytvoriť užívateľsky prívetivú aplikáciu, ktorá umožní nahrávať, šifrovať a komunikovať s dátami prostredníctvom prirodzeného jazyka, pričom zabezpečí plnú kontrolu nad vlastnými užívateľskými dátami. Teoretická časť práce vysvetľuje základné koncepty LLM. Ďalej predstavuje rôzne dostupné modely a nástroje takým spôsobom, aby bol zvolený práve ten najvhodnejší. Praktická časť práce sa zameriava na návrh, vývoj a následné testovanie aplikácie, ktorá poskytuje nástroje na štatistické, matematické a textové analýzy dát. Vytvorená aplikácia umožňuje bezpečné nahrávanie a šifrovanie CSV súborov a ich následnú analýzu pomocou integrovaného lokálneho LLM modelu Llama 3. Výsledky samotného testovania sú následne zhrnuté v prehľadnej tabuľkovej forme. Aplikácia je vzápätí komparovaná s komerčným riešením Lilybank AI za účelom identifikácie silných a slabých stránok oboch týchto konkurenčných riešení. Hodnotiacimi kritériami sú parametre ako cena, flexibilita, bezpečnosť, výkon alebo užívateľská prívetivosť. Práca tak demonštruje a testuje efektivitu použitia alternatívnej open-source LLM v porovnaní s komerčnými nástrojmi a riešeniami, s dôrazom na maximalizáciu bezpečnosti privátnych užívateľských dát.
Keywords: LLM; Veľké jazykové modely; Generatívna umelá inteligencia; Bezpečnosť dát; Llama
Thesis title: Aplikace pro práci s privátními strukturovanými daty za použití LLM nástrojů
Author: Lichvár, Peter
Thesis type: Diplomová práce
Supervisor: Sládek, Pavel
Opponents: Maryška, Miloš
Thesis language: Slovensky
Abstract:
Tato diplomová práce se zabývá návrhem a implementací aplikace využívající velké jazykové modely (LLM) pro bezpečnou a efektivní interakci se soukromými CSV soubory. Cílem je vytvořit uživatelsky přívětivou aplikaci, která umožní nahrávat, šifrovat a komunikovat s daty prostřednictvím přirozeného jazyka, přičemž zajistí plnou kontrolu nad vlastními uživatelskými daty. Teoretická část práce vysvětluje základní koncepty LLM. Dále představuje různé dostupné modely a nástroje takovým způsobem, aby byl zvolen právě ten nejvhodnější. Praktická část práce se zaměřuje na návrh, vývoj a následné testování aplikace, která poskytuje nástroje pro statistické, matematické a textové analýzy dat. Vytvořená aplikace umožňuje bezpečné nahrávání a šifrování CSV souborů a jejich následnou analýzu pomocí integrovaného lokálního LLM modelu Llama 3. Výsledky samotného testování jsou následně shrnuty v přehledné tabulkové formě. Aplikace je vzápětí porovnávána s komerčním řešením Lilybank AI za účelem identifikace silných a slabých stránek obou těchto konkurenčních řešení. Hodnotícími kritérii jsou parametry jako cena, flexibilita, bezpečnost, výkon nebo uživatelská přívětivost. Práce tak demonstruje a testuje efektivitu použití alternativní open-source LLM ve srovnání s komerčními nástroji a řešeními, s důrazem na maximalizaci bezpečnosti soukromých
Keywords: LLM; Velké jazykové modely; Generativní umělá inteligence; Bezpečnost dat; Llama
Thesis title: Application for Working with Private Structured Data Using LLM Tools
Author: Lichvár, Peter
Thesis type: Diploma thesis
Supervisor: Sládek, Pavel
Opponents: Maryška, Miloš
Thesis language: Slovensky
Abstract:
This thesis addresses the design and implementation of an application utilizing large language models (LLM) for secure and efficient interaction with private CSV files. The goal is to create a user-friendly application that allows for uploading, encrypting, and communicating with data through natural language while ensuring full control over user data. The theoretical part of the thesis explains the basic concepts of LLM. It further presents various available models and tools in such a way that the most suitable one is chosen. The practical part focuses on the design, development, and subsequent testing of the application, which provides tools for statistical, mathematical, and textual data analysis. The created application enables secure uploading and encryption of CSV files and their subsequent analysis using the integrated local LLM model Llama 3. The results of the testing are then summarized in a clear tabular form. The application is subsequently compared with the commercial solution Lilybank AI to identify the strengths and weaknesses of both competing solutions. Evaluation criteria include parameters such as price, flexibility, security, performance, and user-friendliness. The thesis demonstrates and tests the effectiveness of using an alternative open-source LLM compared to commercial tools and solutions, with an emphasis on maximizing the security of private user data.
Keywords: Large language models; Generative artificial intelligence; Data security; Llama; LLM

Information about study

Study programme: Data a analytika pro business
Type of study programme: Magisterský studijní program
Assigned degree: Ing.
Institutions assigning academic degree: Vysoká škola ekonomická v Praze
Faculty: Faculty of Informatics and Statistics
Department: Department of Information Technologies

Information on submission and defense

Date of assignment: 20. 11. 2023
Date of submission: 27. 6. 2024
Date of defense: 2024

Files for download

The files will be available after the defense of the thesis.

    Last update: