Velké jazykové modely: výkonnost ve středoškolské češtině a matematice

Česky
English

Název práce:	Velké jazykové modely: výkonnost ve středoškolské češtině a matematice
Autor(ka) práce:	Richter, Jan
Typ práce:	Bakalářská práce
Vedoucí práce:	Chudán, David
Oponenti práce:	Sklenák, Vilém
Jazyk práce:	Česky
Abstrakt:	V posledních letech se velké jazykové modely (LLM) vyvíjejí mimořádně rychle a jejich využití v každodenním životě i odborné praxi výrazně narůstá. Ačkoli jsou tyto modely vyvíjeny převážně v USA a Asii, dokážou komunikovat ve mnoha jazycích, včetně češtiny. Otázkou však zůstává, jak dobře současné LLM českému jazyku skutečně rozumějí a nakolik jsou schopny řešit středoškolské matematické úlohy zadané v češtině. Cílem této bakalářské práce je zhodnotit úroveň jazykových a matematických schopností nejnovější generace LLM a porovnat jejich výkonnost s výsledky starších modelů. Testování probíhalo na úlohách převzatých ze standardizovaných maturitních didaktických testů a testů SCIO, což umožňuje přímé srovnání. Do analýzy byly zahrnuty jak nejmodernější closed-source modely jako je GPT nebo Gemini, tak výkonné open-source modely jako Gemma, Qwen či Llama. Výkonnosti jednotlivých modelů jsou vzájemně porovnány a konfrontovány s daty z bakalářské práce K. Hrabáčové (Hrabáčová, 2024), která mapuje výkonnost starších generací LLM. Výsledky ukazují výrazné zlepšení schopností současných LLM v českém jazyce i matematice, přestože určité slabiny přetrvávají, zejména v oblasti detekce gramatických chyb. Práce tak přispívá k hlubšímu porozumění možnostem i limitům aktuálních LLM a dokládá rychlý vývoj tohoto technologického odvětví.
Klíčová slova:	LLM; velké jazykové modely; AI; umělá inteligence; český jazyk; matematika; komparace LLM; čeština

Název práce:	Large Language Models: Performance in High School Czech Language and Mathematics
Autor(ka) práce:	Richter, Jan
Typ práce:	Bachelor thesis
Vedoucí práce:	Chudán, David
Oponenti práce:	Sklenák, Vilém
Jazyk práce:	Česky
Abstrakt:	In recent years, large language models (LLMs) have been developing at an exceptional pace, and their use in both everyday life and professional practice has grown significantly. Although these models are primarily developed in the United States and Asia, they can communicate in many languages, including Czech. However, the question remains as to how well current LLMs truly understand the Czech language and to what extent they can solve high-school mathematics problems presented in Czech. The aim of this bachelor thesis is to evaluate the level of linguistic and mathematical capabilities of the latest generation of LLMs and to compare their performance with the results of older models. Testing was conducted using tasks adapted from standardized high-school didactic tests and SCIO tests, enabling direct comparison. The analysis incorporates both state-of-the-art closed-source models, such as GPT and Gemini, and powerful open-source models, such as Gemma, Qwen, and Llama. The performance of individual models is cross-compared and compared against data from the bachelor thesis of K. Hrabáčová (Hrabáčová, 2024), which maps the performance of older generations of LLMs. The results demonstrate a significant improvement in the capabilities of current LLMs in both the Czech language and mathematics, although certain weaknesses persist, mainly in the domain of grammatical error detection. This thesis thus contributes to a deeper understanding of the capabilities and limitations of current LLMs and illustrates the rapid evolution of this technological field.
Klíčová slova:	large language models; AI; Czech language; mathematics; comparison of LLMs; LLM; artificial intelligence

Informace o studiu

Studijní program / obor:	Aplikovaná informatika
Typ studijního programu:	Bakalářský studijní program
Přidělovaná hodnost:	Bc.
Instituce přidělující hodnost:	Vysoká škola ekonomická v Praze
Fakulta:	Fakulta informatiky a statistiky
Katedra:	Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce:	23. 5. 2025
Datum podání práce:	5. 12. 2025
Datum obhajoby:	27. 1. 2026
Identifikátor v systému InSIS:	https://insis.vse.cz/zp/92472/podrobnosti

Soubory ke stažení

Hlavní práce
92472_ricj06.pdf, 1.8 MB Stáhnout

Příloha práce
32940_ricj06.zip, 1.1 MB Stáhnout

Příloha práce
32941_ricj06.zip, 625.3 kB Stáhnout

Příloha práce
32942_ricj06.zip, 1.7 MB Stáhnout

Oponentura
88873_sklenak.pdf, 99.7 kB Stáhnout

Hodnocení vedoucího
92472_xchud01.pdf, 104.9 kB Stáhnout