Thesis title: |
Automatické generování myšlenkových map za využití velkých jazykových modelů |
Author: |
Brus, Daniel |
Thesis type: |
Bakalářská práce |
Supervisor: |
Zeman, Václav |
Opponents: |
Dudáš, Marek |
Thesis language: |
Česky |
Abstract: |
Cílem práce je ukázat, jak je možné využít velké jazykové modely pro generování myšlenkových map z textu. K hlavnímu cíli autor dospěl přes tři dílčí cíle. Prvním dílčím cílem je zjistit, zda lze pomocí prompt engineeringu přimět model, aby spolehlivě generoval výstupy ve validních formátech, konkrétně ve strukturách JSON nebo RDF. Druhým dílčím cílem je vytvoření prototypu webové aplikace, která integruje OpenAI API. Třetím dílčím cílem je zhodnotit kvalitu vygenerovaných myšlenkových map a jejich vzájemnou podobnost. Teoretická část práce se soustředí na rešerši literárních a internetových zdrojů. V práci jsou zkoumány faktory, které ovlivňují výstupy velkých jazykových modelů. Především nastavitelné hyperparametry modelů a metody prompt engineeringu. Na závěr teoretické části autor odůvodní volbu matematických a statistických metod a technologií, které jsou použity v praktické části. Praktická část práce je zaměřena na vývoj prototypu webové aplikace, během kterého autor aplikuje poznatky z teoretické části. Autor aplikoval metodu iterativního prompt engineeringu, kdy byl nejprve aplikován generický prompt, který byl postupně vylepšován přidáváním konkrétnějších pokynů a příkladů. Také byla vyzkoušena různá nastavení parametrů modelu, jako jsou teplota a top-p. Iterativním přístupem bylo dosaženo generování validních myšlenkových map. Mapy jsou následně převedeny na jejich „embeddings“, na které jsou aplikovány metody shlukové analýzy a komparace. Výsledkem práce je funkční prototyp webové aplikace na automatické generování myšlenkových map, který integruje OpenAI API a kvantitativní vyhodnocení konzistence modelu založené na shlukové analýze embeddingů myšlenkových map. |
Keywords: |
velké jazykové modely; prompt engineering; Python; OpenAI API; shluková analýza; myšlenkové mapy; JSON |
Thesis title: |
Automatic Generation of Mind Maps with the Use of Large Language Models |
Author: |
Brus, Daniel |
Thesis type: |
Bachelor thesis |
Supervisor: |
Zeman, Václav |
Opponents: |
Dudáš, Marek |
Thesis language: |
Česky |
Abstract: |
The aim of this thesis is to show how large language models can be used to generate mind maps from text. The main objective is achieved through three sub-objectives. The first sub-objective is to verify if the model can be made to reliably generate outputs in valid formats, namely JSON or RDF structures, by only using prompt engineering techniques. The second sub-goal is to create a web application prototype that interacts with the OpenAI API. The third sub-goal is to evaluate how similar the mind maps, generated on the same topics, are to each other. The theoretical part of the thesis focuses on research of a literature and web resources. The thesis examines the factors that influence the outputs of the language models. In particular, the author examines the hyperparameters of large language models and prompt engineering methods. At the end of the theoretical part, the author justifies the choice of mathematical and statistical methods and technologies that are used in the practical part. The practical part of the thesis focuses on the development of a prototype web application, during which the author applies the knowledge gained from the theoretical part. The author used the iterative prompt engineering method, where a generic zero-shot prompt was first applied, which was gradually improved by adding more specific instructions and examples. The author also tried different settings for model parameters such as temperature and top-p. The iterative approach successfully leads to generating valid mind maps. The maps are then converted into their embeddings to which cluster analysis and comparison methods are applied. The outcomes of this thesis are a working prototype of a web application for automatic generation of mind maps that integrates the OpenAI API and quantitative evaluation of model’s consistency based on a cluster analysis of mind map embeddings. |
Keywords: |
large language models; prompt engineering; Python; OpenAI API; cluster analysis; mind maps; JSON |
Information about study
Study programme: |
Aplikovaná informatika |
Type of study programme: |
Bakalářský studijní program |
Assigned degree: |
Bc. |
Institutions assigning academic degree: |
Vysoká škola ekonomická v Praze |
Faculty: |
Faculty of Informatics and Statistics |
Department: |
Department of Information and Knowledge Engineering |
Information on submission and defense
Date of assignment: |
19. 11. 2024 |
Date of submission: |
11. 5. 2025 |
Date of defense: |
2025 |
Files for download
The files will be available after the defense of the thesis.