Comparative evaluation of AI chatbots in education: Truthfullness and completeness of generated information

Thesis title:	Komparatívna evaluácia AI chatbotov vo vzdelávaní: Presnosť a úplnosť generovaných informácií
Author:	Timko, Marek
Thesis type:	Bachelor thesis
Supervisor:	Kovářová, Marie
Opponents:	Maryška, Miloš
Thesis language:	Slovensky
Abstract:	Táto práca sa zaoberá komparatívnou analýzou štyroch pokročilých modelov chatbotov: ChatGPT (GPT-3.5), Copilot (GPT-4), Gemini a LLaMA2, s dôrazom na hodnotenie ich štruktúry odpovedí, pravdivosti a komplexnosti poskytovaných informácií. Práca taktiež poskytuje úvod do problematiky umelej inteligencie a chatbotov. Cieľom bolo analyzovať a porovnať tieto modely z hľadiska ich pravdivosti a úplnosti informácií a identifikovať ich silné a slabé stránky pre aplikácie v školstve. Využité metódy zahŕňali komparatívne hodnotenie a pozorovanie, čím sa zabezpečila objektívnosť a dôkladnosť analýzy. Výsledky odhalili, že každý model má unikátne prednosti vhodné pre rôzne edukačné scenáre: ChatGPT je preferovaný pre základné pedagogické účely, Copilot sa osvedčil v komplexných akademických situáciách pre svoju presnosť, zatiaľ čo Gemini poskytuje rozšírené pokrytie tém, čo ho robí vhodným pre širšie akademické využitie. LLaMA2 nebol testovaný z dôvodu technickej nedostupnosti. Tieto poznatky naznačujú potrebu ďalšieho výskumu a vývoja v oblasti etických a bezpečnostných aspektov AI, aby sa maximalizoval ich potenciál v edukačnom procese.
Keywords:	AI vo vzdelávaní; porovnanie chatbotov; umelá inteligencia; AI chatboti

Thesis title:	Comparative evaluation of AI chatbots in education: Truthfullness and completeness of generated information
Author:	Timko, Marek
Thesis type:	Bachelor thesis
Supervisor:	Kovářová, Marie
Opponents:	Maryška, Miloš
Thesis language:	Slovensky
Abstract:	This thesis deals with a comparative analysis of four advanced chatbot models, ChatGPT (GPT-3.5), Copilot (GPT-4), Gemini and LLaMA2, with an emphasis on the evaluation of their response structure, truthfulness and comprehensiveness of the information provided. The thesis also provides an introduction to artificial intelligence and chatbots. The aim was to analyse and compare these models in terms of their information truthfulness and completeness, and to identify their strengths and weaknesses for applications in education. The methods used included comparative evaluation and observation, thus ensuring objectivity and thoroughness of the analysis. The results revealed that each model has unique strengths suitable for different educational scenarios: the ChatGPT is preferred for basic pedagogical purposes, Copilot has proven itself in complex academic situations due to its accuracy, while Gemini provides extended coverage of topics, making it suitable for broader academic use. LLaMA2 was not tested due to technical unavailability. These findings suggest the need for further research and development into the ethical and safety aspects of AI to maximise its potential in the educational process.
Keywords:	AI chatbots; AI in education; comparison of chatbots; artificial intelligence

Thesis title:	Komparatívna evaluácia AI chatbotov vo vzdelávaní: Presnosť a úplnosť generovaných informácií
Author:	Timko, Marek
Thesis type:	Bakalářská práce
Supervisor:	Kovářová, Marie
Opponents:	Maryška, Miloš
Thesis language:	Slovensky
Abstract:	Tato práce se zabývá komparativní analýzou čtyř pokročilých modelů chatbotů, ChatGPT (GPT-3.5), Copilot (GPT-4), Gemini a LLaMA2, s důrazem na hodnocení struktury jejich odpovědí, pravdivosti a komplexnosti poskytovaných informací. Práce rovněž poskytuje úvod do problematiky umělé inteligence a chatbotů. Cílem bylo analyzovat a porovnat tyto modely z hlediska pravdivosti a úplnosti informací a určit jejich silné a slabé stránky pro aplikace ve vzdělávání. Použité metody zahrnovaly srovnávací hodnocení a pozorování, čímž byla zajištěna objektivita a důkladnost analýzy. Výsledky ukázaly, že každý model má jedinečné silné stránky vhodné pro různé vzdělávací scénáře: ChatGPT je preferován pro základní pedagogické účely, Copilot se díky své přesnosti osvědčil v komplexních akademických situacích, zatímco Gemini poskytuje rozšířené pokrytí témat, takže je vhodný pro širší akademické využití. LLaMA2 nebyl testován z důvodu technické nedostupnosti. Tato zjištění naznačují potřebu dalšího výzkumu a vývoje etických a bezpečnostních aspektů umělé inteligence, aby se maximalizoval její potenciál ve vzdělávacím procesu.
Keywords:	AI chatboti; AI ve vzdělávání; porovnání chatbotů; umělá inteligence

Information about study

Study programme:	Informační média a služby
Type of study programme:	Bakalářský studijní program
Assigned degree:	Bc.
Institutions assigning academic degree:	Vysoká škola ekonomická v Praze
Faculty:	Faculty of Informatics and Statistics
Department:	Department of Information Technologies

Information on submission and defense

Date of assignment:	26. 9. 2023
Date of submission:	5. 5. 2024
Date of defense:	13. 6. 2024
Identifier in the InSIS system:	https://insis.vse.cz/zp/85622/podrobnosti

Files for download

Main text
85622_timm03.pdf, 1.1 MB Download

Opponent's review
81990_maryskam.pdf, 111 kB Download

Supervisor's review
85622_xbalm21.pdf, 104.1 kB Download