趣看热点

新智元报道

编辑：桃子好困

【新智元导读】最强AI智能体编程模型GPT-5.2-Codex登场！上下文压缩，长程任务处理更强，而且还懂网络安全。

GPT-5.2-Codex，深夜突袭！

它是OpenAI迄今为止，最强的AI智能体编程模型，专为复杂、真实世界软件工程而打造。

从名字可以看出，GPT-5.2-Codex基于GPT-5.2进一步优化版本，它在多项能力上实现了关键改进：

· 上下文压缩，提升了长周期任务处理能力

· 在大型代码变更，如重构与迁移上性能更强

· 在原生Windows环境下，编程能力显著增强

· 网络安全能力最强

奥特曼宣称，「OpenAI们」已经用上了，而且还取得了非常好的成效。

在基准测试中，GPT-5.2-Codex在软件工程、终端测试中，击败了5.1-Codex-Max、GPT-5.2、GPT-5.1。

OpenAI博客中多次重点强调，GPT-5.2-Codex在网络安全上，达到了迄今为止最高水平。

就在上周，一位安全研究员用GPT-5.1-Codex-Max+Codex CLI，直接挖出了一个导致源代码泄露的React漏洞。

今天起，所有付费用户皆可用上GPT-5.2-Codex，API将在未来几周开放。

GPT-5.2-Codex编程狂飙，长跑不掉线

全新AI智能体编程GPT-5.2-Codex，简单来说，就是一次「强强联合」。

它不光继承了GPT-5.2原本擅长的「专业工作处理能力」，还学到了5.1-Codex-Max在AI智能体编程和终端操作方面的能力。

这样一来，它的进步就很实在了——

在长上下文理解、工具调用、事实准确性、原生上下文压缩等方面，得到了显著提升。

由此，GPT-5.2-Codex可以稳定支持长时间运行的编程任务，并在推理时更省token。

在业内专业基准测试中，5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0上刷新SOTA。

相较于5.1-Codex，约6%的性能提升。

这两个测试，就是专门用于评估模型在真实终端环境中处理多样化任务时的智能体能力。

同时，它在原生Windows环境中的智能体编程表现也显著增强，进一步扩展了GPT-5.1-Codex-Max所引入的能力。

得益于这些改进，Codex能在大型代码库中长时间工作，并始终保持完整上下文。

这也就意味着，诸如大规模重构、代码迁移和功能开发等复杂任务，GPT-5.2-Codex可以靠谱地完成。

——即便中途方案调整或尝试失败，也能持续迭代而不迷失方向。

不仅如此，GPT-5.2-Codex「视力」更强了。

编程时，直接发给它截图、技术示意图、图表以及各类UI界面，它都能理解得更准。

更厉害的是，它可以直接读取设计稿，并迅速将其转化为可运行的功能原型。

同时，开发者也可以与Codex协作，将这些原型一点点打磨，直到能正式上线使用。

三大跃迁，AI已「攻破」真实世界

在OpenAI的一项核心网络安全评估中，可以明显看到「能力随时间的跃迁」——

· GPT-5-Codex带来了第一次显著提升，

· GPT-5.1-Codex-Max带来了第二次，

· GPT-5.2-Codex则实现了第三次跃迁。

对此，OpenAI判断，未来的AI模型仍将沿着这一趋势持续演进。

在做规划和能力评估时，他们一直假设每一代模型，都有潜力达到「准备框架」（Preparedness Framework）里，定义的「高」等级网络安全能力。

不过，GPT-5.2-Codex目前还未达到这一水平。

那么，在真实世界中，OpenAI的智能体编程模型表现如何？

一周挖出React高危漏洞

12月11日，React团队爆出了：React Server Components的三个安全漏洞。

然后，Stripe旗下公司Privy的首席安全工程师Andrew MacPherson，就决定拿这个漏洞来「测试」一下现在的AI模型到底有多能打。

他使用了GPT-5.1-Codex-Max+Codex CLI，以及其他编程智能体，意外的是，在复现和研究漏洞的过程中，把关键React漏洞挖出来了。

具体实操过程如下——

最初，他尝试了多次零样本学习分析，直接让模型检查补丁并判断其修复的漏洞类型，但并未取得成果。

随后，他转向更高频、迭代式的提示方式；在这些方法仍然无效后，他引导Codex按照标准的防御性安全流程开展工作——搭建本地测试环境、分析潜在攻击面，并通过模糊测试向系统注入异常输入。

在尝试复现原始React2Shell问题的过程中，Codex发现了一些异常行为，值得深入调查。

最终，在短短一周内，这一流程促成了此前未知漏洞的发现，并被以负责任的方式披露给React团队。

这一案例清楚地展示了，先进AI系统如何显著加速真实世界、广泛使用的软件中的防御性安全研究。

网友实测

一位开发者实测GPT-5.2-Codex编写一个模拟道路上车辆与交通灯工作方式的程序，结果失败了。

不过也有人认为，其具备了与Gemini 3 Flash和Pro同样精美的动画效果。

GPT-5.2-Codex在生成一款反恐精英的游戏，表现亮眼。

总言之，OpenAI认为，GPT-5.2-Codex的发布，是AI在真实软件开发与网络安全领域的又一大步。

它让开发者，能轻松应对复杂又耗时的任务，同时也为网络安全研究提供更好的工具支持。

参考资料：

https://openai.com/index/introducing-gpt-5-2-codex/

https://openai.com/index/gpt-5-2-codex-system-card/

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

太狠了！奥特曼亲手「干掉」GPT-5.2，OpenAI祭出最强编程AI

被自称前女友...

AI正在成为...

上市公司购买...

河南有强奸前...

陈浩民夫妇滞...

巴尔韦德：皇...

李亚鹏确认，靠卖北京房子和直播卖茶具，5000万债务已还清！

文班亚昕就这？前三节仅1分末节刷到7分生日夜仍被杜锋战略冰封

向五角大楼匿名捐赠1.3亿美元＂军饷＂的富豪身份披露

不敌王楚钦，松岛辉空：满脑子只有不甘心，混双应该能复仇

陈浩民夫妇滞留阿联酋，半夜发文怀念祖国

百万粉丝博主“稚晖君”在账号发介绍公司机器人视频，引发监管问询！公司紧急回应

女子用＂AI流浪汉＂照片整蛊丈夫引来警察网友表示不解

不止本田遭遇“冰雹”，这些跨国车企如何找回“春天”？

充电十分钟、续航2000公里！宁德时代宣布：2027年量产全固态电池

最高降价30万！宝马中国回应:并非打价格战

徐艺洋机场被偶遇，生图五官优越有星味

纯电续航提升 2026款比亚迪夏将于明日上市

《惊蛰无声》预告质感太差！杨幂没精神刘诗诗像盲人，被嘲像网大

全新宝马X5更新归来！起售价下探至不足60万，轴距超3米1，很亲民

科技感爆棚大众ID. ERA 9X内饰官图发布

在这里，我们拍到了雪原上的一抹瑞红

百色＂锅底＂村庄积水不退村民:明年不想再种地白费劲

宗馥莉辞职41天后有经销商收通知：明年继续卖娃哈哈

布翁焦尔诺谈主场欧冠首秀：听见欧冠主题曲时我感到无比激动

汽车破窗有店铺销量陡增新能源汽车双层玻璃无效

净利润减少超50%，珍酒李渡能靠“大珍”走出低谷吗？

塞萨洛尼基大学推出MBC：让AI大脑像U盘一样随时扩容

小米罗福莉AI团队最新突破，使算力成本直降71.2%

月之暗面创始人杨植麟：中国技术不仅要好用还要参与制定规则