Aplikace pro práci s privátními strukturovanými daty za použití LLM nástrojů

Název práce:	Aplikácia pre prácu s privátnymi štruktúrovanými dátami za použitia LLM nástrojov
Autor(ka) práce:	Lichvár, Peter
Typ práce:	Diplomová práce
Vedoucí práce:	Sládek, Pavel
Oponenti práce:	Maryška, Miloš
Jazyk práce:	Slovensky
Abstrakt:	Táto diplomová práca sa zaoberá návrhom a implementáciou aplikácie využívajúcej veľké jazykové modely (LLM) na bezpečnú a efektívnu interakciu s privátnymi CSV súbormi. Cieľom je vytvoriť užívateľsky prívetivú aplikáciu, ktorá umožní nahrávať, šifrovať a komunikovať s dátami prostredníctvom prirodzeného jazyka, pričom zabezpečí plnú kontrolu nad vlastnými užívateľskými dátami. Teoretická časť práce vysvetľuje základné koncepty LLM. Ďalej predstavuje rôzne dostupné modely a nástroje takým spôsobom, aby bol zvolený práve ten najvhodnejší. Praktická časť práce sa zameriava na návrh, vývoj a následné testovanie aplikácie, ktorá poskytuje nástroje na štatistické, matematické a textové analýzy dát. Vytvorená aplikácia umožňuje bezpečné nahrávanie a šifrovanie CSV súborov a ich následnú analýzu pomocou integrovaného lokálneho LLM modelu Llama 3. Výsledky samotného testovania sú následne zhrnuté v prehľadnej tabuľkovej forme. Aplikácia je vzápätí komparovaná s komerčným riešením Lilybank AI za účelom identifikácie silných a slabých stránok oboch týchto konkurenčných riešení. Hodnotiacimi kritériami sú parametre ako cena, flexibilita, bezpečnosť, výkon alebo užívateľská prívetivosť. Práca tak demonštruje a testuje efektivitu použitia alternatívnej open-source LLM v porovnaní s komerčnými nástrojmi a riešeniami, s dôrazom na maximalizáciu bezpečnosti privátnych užívateľských dát.
Klíčová slova:	LLM; Veľké jazykové modely; Generatívna umelá inteligencia; Bezpečnosť dát; Llama

Název práce:	Application for Working with Private Structured Data Using LLM Tools
Autor(ka) práce:	Lichvár, Peter
Typ práce:	Diploma thesis
Vedoucí práce:	Sládek, Pavel
Oponenti práce:	Maryška, Miloš
Jazyk práce:	Slovensky
Abstrakt:	This thesis addresses the design and implementation of an application utilizing large language models (LLM) for secure and efficient interaction with private CSV files. The goal is to create a user-friendly application that allows for uploading, encrypting, and communicating with data through natural language while ensuring full control over user data. The theoretical part of the thesis explains the basic concepts of LLM. It further presents various available models and tools in such a way that the most suitable one is chosen. The practical part focuses on the design, development, and subsequent testing of the application, which provides tools for statistical, mathematical, and textual data analysis. The created application enables secure uploading and encryption of CSV files and their subsequent analysis using the integrated local LLM model Llama 3. The results of the testing are then summarized in a clear tabular form. The application is subsequently compared with the commercial solution Lilybank AI to identify the strengths and weaknesses of both competing solutions. Evaluation criteria include parameters such as price, flexibility, security, performance, and user-friendliness. The thesis demonstrates and tests the effectiveness of using an alternative open-source LLM compared to commercial tools and solutions, with an emphasis on maximizing the security of private user data.
Klíčová slova:	Large language models; Generative artificial intelligence; Data security; Llama; LLM

Název práce:	Aplikace pro práci s privátními strukturovanými daty za použití LLM nástrojů
Autor(ka) práce:	Lichvár, Peter
Typ práce:	Diplomová práce
Vedoucí práce:	Sládek, Pavel
Oponenti práce:	Maryška, Miloš
Jazyk práce:	Slovensky
Abstrakt:	Tato diplomová práce se zabývá návrhem a implementací aplikace využívající velké jazykové modely (LLM) pro bezpečnou a efektivní interakci se soukromými CSV soubory. Cílem je vytvořit uživatelsky přívětivou aplikaci, která umožní nahrávat, šifrovat a komunikovat s daty prostřednictvím přirozeného jazyka, přičemž zajistí plnou kontrolu nad vlastními uživatelskými daty. Teoretická část práce vysvětluje základní koncepty LLM. Dále představuje různé dostupné modely a nástroje takovým způsobem, aby byl zvolen právě ten nejvhodnější. Praktická část práce se zaměřuje na návrh, vývoj a následné testování aplikace, která poskytuje nástroje pro statistické, matematické a textové analýzy dat. Vytvořená aplikace umožňuje bezpečné nahrávání a šifrování CSV souborů a jejich následnou analýzu pomocí integrovaného lokálního LLM modelu Llama 3. Výsledky samotného testování jsou následně shrnuty v přehledné tabulkové formě. Aplikace je vzápětí porovnávána s komerčním řešením Lilybank AI za účelem identifikace silných a slabých stránek obou těchto konkurenčních řešení. Hodnotícími kritérii jsou parametry jako cena, flexibilita, bezpečnost, výkon nebo uživatelská přívětivost. Práce tak demonstruje a testuje efektivitu použití alternativní open-source LLM ve srovnání s komerčními nástroji a řešeními, s důrazem na maximalizaci bezpečnosti soukromých
Klíčová slova:	LLM; Velké jazykové modely; Generativní umělá inteligence; Bezpečnost dat; Llama

Informace o studiu

Studijní program / obor:	Data a analytika pro business
Typ studijního programu:	Magisterský studijní program
Přidělovaná hodnost:	Ing.
Instituce přidělující hodnost:	Vysoká škola ekonomická v Praze
Fakulta:	Fakulta informatiky a statistiky
Katedra:	Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce:	20. 11. 2023
Datum podání práce:	27. 6. 2024
Datum obhajoby:	30. 9. 2024
Identifikátor v systému InSIS:	https://insis.vse.cz/zp/84139/podrobnosti

Soubory ke stažení

Hlavní práce
84139_licp00.pdf, 3.6 MB Stáhnout

Veřejná příloha
29419_licp00.zip, 8.4 MB Stáhnout

Oponentura
81252_maryskam.pdf, 98.2 kB Stáhnout

Hodnocení vedoucího
84139_xslap13.pdf, 122.8 kB Stáhnout