关闭广告

刚被马斯克收购,Cursor新模型:10万卡加持,和Opus、GPT一样大

机器之心Pro137人阅读

编辑 | 泽南、陈陈

刚刚被 SpaceX 宣布以 600 亿美元收购的 Cursor,发布大模型了。

本周二,Cursor 宣布了一个新的1.5 万亿 + 参数模型,该模型在超过10 万块 GPU上进行了预训练。



消息是在旧金山举行的 Cursor Compile 上宣布的,这是 Cursor 举办的首届旗舰大会。

根据 Cursor 年仅 25 岁的 CEO Michael Truell 的说法,新模型规模和 Opus、GPT 一样大。Opus 4.5 到 4.8,以及 GPT-5 到 GPT-5.5,其实都没有那么大!它们都低于 2 万亿参数(啊!好像发现了什么大秘密)。

这意味着,以 GPT-5.5 和 Opus 4.8 当前的性能,对开源模型来说是可以达到的。



Michael 认为现在这个阶段,唯一的护城河就是规模化扩展。

到目前为止,Anthropic 是唯一一家成功跃迁到约 10 万亿参数规模的 AI 实验室,Michael 认为 OpenAI 想在年底前重新追上 Anthropic 并不容易。Anthropic 只需要在接下来一到两年里继续往 Mythos 上砸 RL 计算资源,它就会持续变强。

Michael 也谈到了他对其他几家头部 AI 实验室的看法。在他看来,Google 的模型规模没有推到同等水平,同时在稀疏化路线上走得过于激进,后训练和强化学习能力也还没有充分转化为稳定、好用的产品体验。OpenAI 则仍在消化 GPT-4.5 之后的路线调整压力,xAI 和 Meta 还在为下一阶段的大模型竞争做准备。



不过,也有人很快提出质疑:Michael 所说的「Opus 和 GPT-5.5 万亿参数模型」到底从何而来?令人怀疑。



抛开这些外部判断,Cursor 这次真正值得关注的地方在于:它不再只满足于调用现成模型,而是开始系统性训练自己的底座模型。

这也是 Michael Truell 在演讲中首次较完整披露的新模型计划。



视频链接:https://mp.weixin.qq.com/s/12M8FmYM5Sv8jVpBQCGyPw

和 Cursor 过去使用的模型相比,这个新模型有三个明显变化。

第一,它的规模更大。这是他们迄今为止训练过的最大模型,规模已经接近前沿大模型公司的水准。

第二,它是从零开始训练的,不是基于开源模型继续微调(这家公司前段时间还曾卷入「Cursor 套壳 Kimi」的争议)。Michael 也特别补充说,他们依然喜欢开源,也希望未来能找到更多回馈开源社区的方式。但从零训练的好处在于,团队可以更完整地控制模型行为,并让模型更贴合他们和开发者真正关心的工作负载。

第三,这次训练使用的算力规模远超以往。相比他们过去能动用的算力,这次大约提升了 10 到 20 倍。过去从 Composer 1 到 Composer 2.5,相关模型更多是在相对有限的算力条件下训练出来的,和前沿实验室相比差距很大。这也限制了模型能力继续提升的空间。因为很多改进最终都会受制于一个问题:能不能用更多 GPU、跑更长时间的训练。现在算力规模上来之后,他们认为模型会有机会带来真正差异化的能力。

更重要的是,这个新模型不会只面向代码能力。团队希望它具备更通用的智能,因为 Cursor 的目标不只是让 AI 写代码,而是让任何人都能构建自己想要的东西。眼下真正的瓶颈,已经不只是「代码写得好不好」,而是 AI 能不能像一个工程师同事一样工作。

这意味着模型需要会使用工程师常用的工具,能做规划,能测试软件,能真正点进界面里检查按钮和交互,也能清楚地向用户展示 Agent 到底改了什么。换句话说,Cursor 想把模型能力从单纯的代码生成,推进到更完整的软件工程协作能力。

演讲中,Michael 还提到,这个模型的训练已经启动,预计会在接下来的几周内发布。相关能力背后也有外部算力或基础设施合作支持。这背后的支持说的肯定是 SpaceX 了。

当然,真正的答案还要等模型发布后才能揭晓。

https://x.com/scaling01/status/2067017700384125238

https://x.com/Yuchenj_UW/status/2066891492187320405

https://x.com/nickadobos/status/2066929277757800833?s=46

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德约回应针对他受伤的新闻:媒体总爱断章取义

网球之家 浏览 2083

别管怎么质疑《寻秦记》,只要古天乐、林峯在,再烂我都会买单

最爱酷影视 浏览 2383

李羲承退出ENHYPEN,组合未来将以六人形式活动

精彩背后的故事 浏览 1528

不敌王楚钦,松岛辉空:满脑子只有不甘心,混双应该能复仇

懂球帝 浏览 2236

美官员:特朗普不满伊朗新提案 核问题须优先解决

界面新闻 浏览 871

燕翔:微盘股策略的逆向投资特征

首席经济学家论坛 浏览 2653

有纯电/增程 极狐全新阿尔法T5预售12.38万起

网易汽车 浏览 2881

eSIM手机,来了!

中国基金报 浏览 3006

科大讯飞AI创新成果亮相第十届版博会

中安在线 浏览 2872

餐馆称免费加面游客二次续面却被要求付3元 官方通报

封面新闻 浏览 7060

明年上半年上市 奇瑞风云实车A9 EV亮相

车质网 浏览 2514

这些才是适合普通人的穿搭!秋天多穿蓝色单品和风衣,好耐看

静儿时尚达人 浏览 2765

CBA疯狂一夜!争冠形势大乱:北京送广东首败,助攻广厦升至第一

侃球熊弟 浏览 2136

专家解读:“最后期限”前 美国伊朗如何出牌

新华社 浏览 1952

从L3规模运营到L4全球输出,北汽新能源自动驾驶商业化版图已明

北京商报 浏览 2122

【进博时刻】每天训它几百遍,这份枯燥的工作并非冷冰冰

上观新闻 浏览 2455

日本知名女星结婚:酷似高圆圆 曾和林志玲老公交往

新民周刊 浏览 7522

仅2.2万,王晶贺岁档新片票房崩塌,我感慨:观众不再为情怀买单

靠谱电影君 浏览 2034

穿来穿去还是羽绒服最靠谱!配裤子裙子都合适,舒适自然保暖

静儿时尚达人 浏览 2168

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

界面新闻 浏览 2861

特朗普再酝酿对伊打击 美伊谈判连放信号

国际在线 浏览 448
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1