Self-Corrective Assistant for Software Development
Název práce: | Self-Corrective Assistant for Software Development |
---|---|
Autor(ka) práce: | Obukhov, Maksim |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Vencovský, Filip |
Oponenti práce: | Chudán, David |
Jazyk práce: | English |
Abstrakt: | Programming plays a central role in modern problem-solving. The advent of Large Language Models (LLMs) has significantly advanced program synthesis, facilitating automatic code generation. However, LLMs still struggle with complex algorithmic problems required developer's thinking and precision in implementation. This study introduces a self-corrective multi-agent system designed to enhance the problem-solving abilities of LLMs. The system employs a graph-based workflow with seven specialised agents: Simplifier, Self-retrieval, Planning, Ranking, Test Case Generator, Coding, and an Iterative Self-correction agent, along with a code execution node. These agents work together to break down problems, retrieve relevant data, generate and evaluate multiple solutions, test the generated code, and refine it iteratively. The system's performance is evaluated using DeepMind's CodeContests dataset, benchmarking it against established models like Reflexion, AlphaCodium, and MapCoder. The proposed system outperforms existing baselines, achieving a Pass@1 rate of 26.50% and a Pass@4 rate of 35.04%. In terms of cost effectiveness, it demonstrates an average cost per problem of $0.0883 and an average token usage of 17,082.46 tokens per solution, outperforming state-of-the-art models in both efficacy and efficiency. |
Klíčová slova: | Large language models; Code generation; Algorithmic problem-solving; Multi-agent system; Competitive programming |
Název práce: | Self-Corrective Assistant for Software Development |
---|---|
Autor(ka) práce: | Obukhov, Maksim |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Vencovský, Filip |
Oponenti práce: | Chudán, David |
Jazyk práce: | English |
Abstrakt: | Programování hraje klíčovou roli v moderním řešení problémů. Příchod Velkých jazykových modelů (LLM) výrazně pokročil v syntéze programů a usnadnil automatické generování kódu. LLM však stále mají problémy se složitými algoritmickými úlohami vyžadujícími vývojářské myšlení a přesnost implementace. Tato studie představuje sebekorekční multi-agentní systém navržený ke zlepšení schopností LLM řešit problémy. Systém využívá pracovní postup založený na grafu se sedmi specializovanými agenty: Simplifier, Self-retrieval, Planning, Ranking, Test Case Generator, Coding a Iterative Self-correction, spolu s uzlem pro spouštění kódu. Tito agenti spolupracují na rozkladu problémů, získávání relevantních dat, generování a hodnocení více řešení, testování generovaného kódu a jeho iterativním vylepšování. Výkon systému je hodnocen pomocí datasetu CodeContests od DeepMind, porovnáván s etablovanými modely jako Reflexion, AlphaCodium a MapCoder. Navržený systém překonává existující standardy s mírou úspěšnosti Pass@1 26,50 % a Pass@4 35,04 %. Z hlediska nákladové efektivity vykazuje průměrné náklady na problém 0,0883 $ a průměrné využití 17082,46 tokenů na řešení, čímž překonává současné špičkové modely v účinnosti i efektivitě. |
Klíčová slova: | Soutěžní programování; Velké jazykové modely; Generování kódu; Multi-agentní systém; Algoritmické řešení problémů |
Informace o studiu
Studijní program / obor: | Data Analytics |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 1. 2. 2024 |
---|---|
Datum podání práce: | 5. 12. 2024 |
Datum obhajoby: | 29. 1. 2025 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/88256/podrobnosti |