NeoBeta - AI 科技资讯

Google 分享了 CodeMender 的早期研究成果，这是一个新的 AI 驱动代理，旨在自动提高代码安全性。软件漏洞对开发者来说通常难以发现和修复，即使使用传统的自动化方法如模糊测试。CodeMender 采用综合方法，既反应性地即时修补新漏洞，又主动地重写和加固现有代码，消除整个类别的漏洞。在过去的六个月中，CodeMender 已为开源项目上游了 72 个安全修复，包括一些多达 450 万行代码的项目。

CodeMender 通过利用最近的 Gemini Deep Think 模型的思考能力，创建一个能够调试和修复复杂漏洞的自主代理。该代理配备了强大的工具，使其在修改代码前进行推理，并自动验证更改以确保正确性且不引起回归。CodeMender 的自动验证过程确保代码更改在多个维度上正确，仅向人工审查展示高质量补丁，例如修复问题的根本原因、功能正确、无回归并遵循风格指南。

作为研究的一部分，Google 还开发了新技术和工具，使 CodeMender 能更有效地推理代码和验证更改。这包括使用调试器、源代码浏览器等工具来精确定位根本原因并设计补丁。CodeMender 能够处理复杂漏洞，例如在示例中，它识别了堆缓冲区溢出的根本原因，并修改了自定义的 C 代码生成系统。

背景阅读

代码安全是软件开发中的关键挑战，传统方法如模糊测试和静态分析虽能发现漏洞，但修复过程往往依赖人工，耗时且易出错。近年来，AI 在漏洞发现方面取得进展，例如 Google 的 Big Sleep 和 OSS-Fuzz 项目展示了 AI 在发现零日漏洞方面的潜力。随着 AI 技术的进步，自动修复漏洞成为可能，这有助于减轻开发者的负担并提高软件安全性。CodeMender 基于 Gemini 模型，结合了推理和验证工具，代表了 AI 在代码安全领域从发现到修复的扩展应用。

CodeMender：AI 代理自动修复代码安全漏洞

背景阅读

相关阅读

OpenSlopware 项目曝光 AI 生成开源软件，因骚扰被删除后遭分叉

DeepMind 发布前沿安全框架第三版，新增有害操纵风险评估

Gemini Deep Think 高级版在国际数学奥林匹克竞赛中达到金牌标准

评论 (0)