Využití velkých jazykových modelů pro indukci pravidel na základě příkladů z textu

Česky
English

Název práce:	Využití velkých jazykových modelů pro indukci pravidel na základě příkladů z textu
Autor(ka) práce:	Jurášek, Eduard
Typ práce:	Bakalářská práce
Vedoucí práce:	Kliegr, Tomáš
Oponenti práce:	Máša, Petr
Jazyk práce:	Česky
Abstrakt:	Předkládaná práce se zabývá možností využití velkých jazykových modelů pro hledání častých vzorů. V návaznosti na zadání práce, kterým bylo experimentálně ověřit schopnost LLM indukovat obecná pravidla popisující společné charakteristiky zadaného malého počtu příkladů, se práce skládá ze tří cílů. Hlavním cílem jsou experimenty s volně dostupnými jazykovými modely (LLM). Další cíle tvoří rešerše postupů pro LLMs a vyhodnocení experimentů včetně porovnání s existujícími přístupy pro nalézání pravidel za použití algoritmů Apriori a FP-Growth. V rámci práce byly provedeny experimenty se třemi LLMs (Copilot, Gemini a ChatGPT-3.5) v kombinacemi s osmi zadáními promptů zaměřenými na vypsání častých množin položek vyskytujících v několika verzích malého vstupního datasetu. Ve výchozí verzi obsahoval dataset všeobecně známé názvy sloupců i jejich hodnoty (názvy zvířat a jejich vlastností). V dalších verzích byly postupně tyto údaje zamaskovány a nahrazeny bezvýznamovými identifikátory. Nejlepších výsledků dosáhl Copilot, který dosahoval až 100 % správnosti u datasetu s bezvýznamovými identifikátory, ale výrazně nižší správnosti na původních datech. Podobný trend, kdy bezvýznamové identifikátory vedly k lepším výsledkům, byl patrný i u modelu ChatGPT-3.5 (počítá-li se výsledek jako aritmetický průměr všech osmi experimentů). Je otázkou, zda by tento postup fungoval i na větší datasety a jiné domény.
Klíčová slova:	podpora; spolehlivost; ChatGPT; Bing Chat; Copilot; CSV; Google Bard; Google Gemini; GUHA; itemsety; asociační pravidla; algoritmus Apriori; algoritmus FP- Growth; Python; EasyMiner

Název práce:	Usage of Large Language Models for Rules Induction based on the Examples from Text
Autor(ka) práce:	Jurášek, Eduard
Typ práce:	Bachelor thesis
Vedoucí práce:	Kliegr, Tomáš
Oponenti práce:	Máša, Petr
Jazyk práce:	Česky
Abstrakt:	The presented thesis addresses the possibility of using large language models for frequent pattern searches. Following the terms of reference of the thesis, which was to experimentally verify the ability of the LLM to induce general rules describing common characteristics of a given small number of examples, the thesis consists of three objectives. The main objective is to experiment with freely available language models (LLMs). The other objectives consist of a search of the procedures for the LLMs and an evaluation of the experiments, including a comparison with an existing approach for rule finding compared to Apriori and FP-Growth algorithms. In this thesis, experiments were conducted with three LLMs (Copilot, Gemini, and ChatGPT-3.5) in combination with eight prompt tasks focused on writing the frequent groups of items that occur in some versions of the small input dataset. In the original version, the dataset consisted of familiar column names and their values (names of the animals and their characteristics). In other versions, the actual information was masked and replaced with meaningless identifiers. The best results were obtained from the Copilot model, which scored up to 100% accuracy in the datasets with meaningless identifiers, but significantly lower than in the original data. A similar trend, where meaningless identifiers lead to better results could be spotted in the ChatGPT-3.5 model (if the result counts as the arithmetical mean of all eight experiments). It is questionable if this procedure would work on larger datasets and other domains.
Klíčová slova:	ChatGPT; Bing Chat; Copilot; CSV; Google Bard; Google Gemini; GUHA; itemsets; association rules; Apriori algorithm; FP-Growth algorithm; EasyMiner; support; confidence; Python

Informace o studiu

Studijní program / obor:	Aplikovaná informatika
Typ studijního programu:	Bakalářský studijní program
Přidělovaná hodnost:	Bc.
Instituce přidělující hodnost:	Vysoká škola ekonomická v Praze
Fakulta:	Fakulta informatiky a statistiky
Katedra:	Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce:	7. 12. 2023
Datum podání práce:	5. 5. 2024
Datum obhajoby:	14. 6. 2024
Identifikátor v systému InSIS:	https://insis.vse.cz/zp/86831/podrobnosti

Soubory ke stažení

Hlavní práce
86831_jure01.pdf, 1.8 MB Stáhnout

Oponentura
82333_xmasp06.pdf, 104.5 kB Stáhnout

Hodnocení vedoucího
86831_klit01.pdf, 111.4 kB Stáhnout