Self-Corrective Assistant for Software Development

English
Česky

Název práce:	Self-Corrective Assistant for Software Development
Autor(ka) práce:	Obukhov, Maksim
Typ práce:	Bachelor thesis
Vedoucí práce:	Vencovský, Filip
Oponenti práce:	Chudán, David
Jazyk práce:	English
Abstrakt:	Programming plays a central role in modern problem-solving. The advent of Large Language Models (LLMs) has significantly advanced program synthesis, facilitating automatic code generation. However, LLMs still struggle with complex algorithmic problems required developer's thinking and precision in implementation. This study introduces a self-corrective multi-agent system designed to enhance the problem-solving abilities of LLMs. The system employs a graph-based workflow with seven specialised agents: Simplifier, Self-retrieval, Planning, Ranking, Test Case Generator, Coding, and an Iterative Self-correction agent, along with a code execution node. These agents work together to break down problems, retrieve relevant data, generate and evaluate multiple solutions, test the generated code, and refine it iteratively. The system's performance is evaluated using DeepMind's CodeContests dataset, benchmarking it against established models like Reflexion, AlphaCodium, and MapCoder. The proposed system outperforms existing baselines, achieving a Pass@1 rate of 26.50% and a Pass@4 rate of 35.04%. In terms of cost effectiveness, it demonstrates an average cost per problem of $0.0883 and an average token usage of 17,082.46 tokens per solution, outperforming state-of-the-art models in both efficacy and efficiency.
Klíčová slova:	Large language models; Code generation; Algorithmic problem-solving; Multi-agent system; Competitive programming

Název práce:	Self-Corrective Assistant for Software Development
Autor(ka) práce:	Obukhov, Maksim
Typ práce:	Bakalářská práce
Vedoucí práce:	Vencovský, Filip
Oponenti práce:	Chudán, David
Jazyk práce:	English
Abstrakt:	Programování hraje klíčovou roli v moderním řešení problémů. Příchod Velkých jazykových modelů (LLM) výrazně pokročil v syntéze programů a usnadnil automatické generování kódu. LLM však stále mají problémy se složitými algoritmickými úlohami vyžadujícími vývojářské myšlení a přesnost implementace. Tato studie představuje sebekorekční multi-agentní systém navržený ke zlepšení schopností LLM řešit problémy. Systém využívá pracovní postup založený na grafu se sedmi specializovanými agenty: Simplifier, Self-retrieval, Planning, Ranking, Test Case Generator, Coding a Iterative Self-correction, spolu s uzlem pro spouštění kódu. Tito agenti spolupracují na rozkladu problémů, získávání relevantních dat, generování a hodnocení více řešení, testování generovaného kódu a jeho iterativním vylepšování. Výkon systému je hodnocen pomocí datasetu CodeContests od DeepMind, porovnáván s etablovanými modely jako Reflexion, AlphaCodium a MapCoder. Navržený systém překonává existující standardy s mírou úspěšnosti Pass@1 26,50 % a Pass@4 35,04 %. Z hlediska nákladové efektivity vykazuje průměrné náklady na problém 0,0883 $ a průměrné využití 17082,46 tokenů na řešení, čímž překonává současné špičkové modely v účinnosti i efektivitě.
Klíčová slova:	Soutěžní programování; Velké jazykové modely; Generování kódu; Multi-agentní systém; Algoritmické řešení problémů

Informace o studiu

Studijní program / obor:	Data Analytics
Typ studijního programu:	Bakalářský studijní program
Přidělovaná hodnost:	Bc.
Instituce přidělující hodnost:	Vysoká škola ekonomická v Praze
Fakulta:	Fakulta informatiky a statistiky
Katedra:	Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce:	1. 2. 2024
Datum podání práce:	5. 12. 2024
Datum obhajoby:	29. 1. 2025
Identifikátor v systému InSIS:	https://insis.vse.cz/zp/88256/podrobnosti

Soubory ke stažení

Hlavní práce
88256_obum00.pdf, 1.1 MB Stáhnout

Oponentura
84732_xchud01.pdf, 126.1 kB Stáhnout

Hodnocení vedoucího
88256_xvenf00.pdf, 121.8 kB Stáhnout