关闭广告

没有商业模式--DeepSeek最坚固的“护城河”

华尔街见闻官方911人阅读

在即将到来的1月27日——也就是“DeepSeek时刻”一周年之际,全球AI社区都期待DeepSeek再来个大招。

市场喧嚣期待之时,知名科技评论作者Kevin Xu发布长文对DeepSeek的商业模式、护城河进行了分析,在AI圈内引起了很大反响。

他认为,DeepSeek最坚固的护城河,是它零外部融资、无商业化压力的独特模式。在全球AI巨头都被资本裹挟着必须赚钱的时候,DeepSeek是唯一一个可以不计成本、不看脸色、只为AGI梦想狂奔的“自由人”。

Kevin S. Xu(徐凯文)是专注中美科技与资本交叉领域的独立观察者,知名科技评论人。他创办的ChinaTalk播客及Newsletter在专业圈层颇具影响力,擅长从资本流向、组织行为与地缘政治多维度解构技术演进逻辑。

我们给大家梳理了一下文章要点:

  • 给市场预期泼盆冷水:虽然大家都在等DeepSeek的新模型,但作者直言“不要指望它能像去年那样再次震惊世界”。因为现在的市场已经被“开源模型”喂饱了,DeepSeek虽然打响了第一枪,但现在并不是唯一、也不是最开源的玩家了(比如它至今没开源数据集)。
  • 唯一的“零融资”异类:现在的AI圈就是“销金窟”,连马斯克都没扛住,最近也给xAI融了一笔高达200亿美元的巨资。但DeepSeek的老板梁文锋至今坚持“零外部融资”,这在所有顶尖实验室里是独一份的,他把控制权看得比钱重。
  • 超级“印钞机”兜底:梁文锋能这么硬气,是因为他背后的量化基金“幻方量化”太赚钱了。去年,幻方以53%的回报率赚了超7亿美元(约50亿人民币)的利润。梁文锋直接把这些钱拿来买显卡、招人,这种用“老钱”养“新梦”的模式,让他完全不需要看投资人的脸色。
  • 被VC拒绝反而是福报:2023年DeepSeek刚成立时其实找过融资,但当时国内VC普遍短视、不敢投,结果这反而成了“塞翁失马”。作者认为,一旦拿了VC的钱,就必须背上商业化KPI,动作就会变形,而现在的DeepSeek只需要对技术负责,不需要对财报负责。
  • “钱多”麻烦多:这是一个非常深刻的洞察——钱太多会滋生“大公司病”。作者举了个很讽刺的例子:有些富得流油的实验室(比如Thinking Machines),甚至在办公室健身房里用上了印着自家Logo的定制杠铃片。这种浮夸的排场背后,是员工盯着期权带来的“纸面富贵”,部门之间为了争夺算力资源搞“宫斗”。而DeepSeek因为没有外部估值,团队极度扁平,没有资源内耗。
  • 算力不是万能药:文章引用了前OpenAI大神Ilya Sutskever的观点——真正的颠覆性创新往往不需要无限堆算力。Transformer架构当年只用了8到64张卡就跑出来了。钱太多反而会让团队变懒,以为堆算力就能解决一切,从而失去了“科研品味”。
  • 投资人的终极悖论:最后,作者站在一位投资人的角度发出了一声叹息——作为一个投资人,他做梦都想投DeepSeek;但他心里也清楚,一旦DeepSeek接受了外部投资,那种纯粹的特质就会消失了

作者原文如下(由AI翻译):

没有商业模式:DeepSeek的长期优势
作者:Kevin S. Xu
随着1月27日“DeepSeek时刻(DeepSeek Moment)”一周年纪念日的临近,市场对于DeepSeek在农历新年(2月17日)前发布一款更强大新模型的期待正日益高涨。
然而,过高的期望几乎注定会带来失望。虽然我也急切地等待着这款新模型,想看看DeepSeek究竟在忙些什么,但我并不预期它会像一年前那样再次震惊市场。整个AI行业乃至更广泛的市场,已经习惯了每隔一两个月就有一款新的“开放权重”模型发布,尤其是来自中国实验室的模型,它们即便算不上最尖端,也往往表现扎实。凭借着开放和免费的特性,这些模型正以一种无法追踪和溯源的方式在各地获得牵引力——这也是开源技术整体上的一种美德(或者说是缺陷)。正如英伟达CEO黄仁勋喜欢说的那样,以Token生成量计算,世界上最大的AI仍然是OpenAI,但第二大的,是开源AI。
DeepSeek或许在去年通过发布V3和R1打响了MIT License许可的开源模型的第一枪,但其他实验室迅速跟进,从同样来自中国的竞争对手阿里巴巴及其Qwen(通义千问)模型系列,到OpenAI推出的gpt-oss模型。(两者均使用Apache 2.0许可,这是另一种常见的开源宽松许可。)正如我之前指出的,如果不是因为DeepSeek,OpenAI可能永远不会感受到压力,从而去兑现其开源根源的承诺,哪怕只是口头上的,比如发布gpt-oss。虽然DeepSeek继续开源其模型的权重以及各种工具和库,但它已不再是市场上最开放的实验室,因为它从未开放过其用于训练模型的数据集或主代码库。
根据Artificial Analysis的数据,目前全球开放程度排名前三的模型分别来自NVIDIA(Nemotron 3)、Allen Institute(Olmo 3)和穆罕默德·本·扎耶德人工智能大学(MBZUAI,K2-V2)。

因此,DeepSeek的模型不再是开放模型中能力最强的,不再是最便宜的,甚至也不再是最开放的。那么,是否还有一个充分的理由,让我们继续给予这个曾经震惊世界的实验室超乎寻常的关注?
是的,我认为有。但不是因为它的模型或技术进步,而是因为其内部的激励机制和商业模式。更确切地说,我们应该关注DeepSeek,因为它没有商业模式——在中国、美国及其他地区的所有前沿实验室中,这是一个独特且反直觉的特性,而非缺陷。
1. 自筹资金支撑的 AGI 梦想早在DeepSeek迎来其“高光时刻”并成为家喻户晓的名字之前的几周,我首次撰写关于DeepSeek的文章时(当时也在ChinaTalk播客上讨论过),就提到了这种“无商业模式优势”。值得注意的是,当整个AI世界都被资本淹没时,这种优势竟表现得如此顽固且持久。
梁文锋没有筹集任何外部资金。该实验室确实通过其API服务产生一些收入,但仍在不断降低定价。梁文锋满足于用他的量化基金——幻方量化的收益来资助DeepSeek的研发,正是幻方量化最初孵化了DeepSeek。需要明确的是,梁文锋在2023年ChatGPT推出几个月后想要创办DeepSeek时,确实曾尝试从中国投资者那里筹集风险投资。但他那“笃信AGI(AGI-pilled)”的理想主义,加上缺乏商业计划书,以及中国VC著名的短视和风险厌恶,导致了那次融资努力的失败——但这反而塞翁失马,焉知非福。
随着2025年的飞逝,为了不错过更多潜在的进步,越来越多的资金涌入,资助了更多的AI进展。每一个哪怕只有一点点牵引力的实验室都筹集了更多的钱,随之而来的是对未来商业化的更多期望。一批所谓的“AI新实验室”——由明星研究员领导的、风投支持的纯研究实验室——如雨后春笋般涌现,例如Thinking Machines Lab(Mira Murati)、SSI(Ilya Sutskever)和AMI Labs(Yann LeCun)。甚至连我过去常拿来与DeepSeek做最紧密类比的xAI——因为它们同样缺乏商业化的紧迫性——也屈服于外部资本的诱惑。几天前,埃隆·马斯克(Elon Musk)的实验室完成了一轮200亿美元的E轮融资,资金结构包含了股权和债权。
即便是世界上最富有的人之一,也无法对更多的钱说“不”!与此同时,梁文锋继续自筹资金维持他那神秘的店铺和他的AGI梦想。当然,梁文锋的量化基金去年业绩辉煌,以53%的回报率创造了超过7亿美元的利润,这无疑提供了巨大帮助。据推测,这些利润的大部分都投入到了购买更多GPU(尽管面临美国的出口管制,但尽其所能)和招聘人才上,以继续推动DeepSeek的研究路线图。尽管如此,在DeepSeek获得全球知名度并在AI行业实现100%的品牌认知度之后,筹集一二十亿美元以加速其步伐本应是轻而易举的事。无论你爱它还是恨它,每个人都听说过它。
然而,对外部资金说“不”,让你能够掌控自己的命运。如果你的自定命运是“致力于让AGI成为现实……用好奇心解开AGI之谜……用长期主义回答本质问题”——这是DeepSeek在HuggingFace页面上的标语——那么用较少的资金换取完全的控制权是一个值得的权衡。当然,你也可以通过一些“公司治理创新”来达到目的。Thinking Machines Lab就是这种情况,创始人的1票投票权价值比所有其他董事会成员的票数总和还多1票,从而实际上拥有完全控制权。但无论你在董事会层面如何“创新”,一旦你接受了风险投资,为了产生风投规模的回报而进行的大规模商业化,迟早是会被期待的。
DeepSeek没有任何这些预期。因此,它没有商业模式,也不需要商业模式。通往AGI的道路需要算力、人才,以及相当剂量的良好研究品味。没人规定它必须需要一个商业模式。
2. 钱多麻烦多,没钱没烦恼当然,筹集更多资金最常见的理由是为了购买更多的算力来支持研究。然而,并不显见的是,要产出好的研究成果,更多的算力总是必要的。
这一洞察并非DeepSeek那独特的自筹资金架构所独有。Ilya Sutskever,这位可以说是拥有最佳研究品味的AI研究员,也表示同意。他在Dwarkesh播客中用自己的话说道:
“算力规模已经足够大,以至于并不显见你需要那么多额外的算力来证明某个想法。我给你打个比方。AlexNet是建立在两块GPU上的。那是用于它的总算力。Transformer是建立在8到64块GPU上的。2017年没有哪篇Transformer论文的实验使用了超过64块GPU,这相当于什么,今天的两块GPU?ResNet也是如此,对吧?你可以争辩说,o1推理模型(o1 reasoning)并不是世界上最耗算力的东西。
因此,对于研究来说,你绝对需要一定量的算力,但远非显而易见的是,你需要绝对最大量的算力来进行研究。”

另一方面,通过消除外部资金的附带条件,以及“仅仅因为有钱就必须购买更多算力”的必要性,两种组织层面的优势显现出来。而DeepSeek两者兼备。

首先,即使资源更加有限,内部也不存在资源竞争。这里没有官僚主义、内斗、权力斗争,也没有为了决定GPU是应该支持新产品发布、扩展现有流行服务的推理需求,还是分配给一个新的研究想法而进行的利益交换。在一个没有外部资金、没有商业模式的小型实验室里,良好的研究品味和新想法可以得到最大程度的支持和拥抱,即使绝对层面上的总算力是有限的。

其次,基于薪酬、津贴或团队获得的算力多少而产生的嫉妒和等级秩序更少,而这些往往是有毒的,却根植于人性之中。你的组织瞬间变得扁平,并且可以保持扁平。伴随外部资金而来的不仅是商业模式的期望,还有估值、股票期权,以及一个高估值AI实验室所有的浮华装饰,无论这种估值在早期是多么没有意义。来自梦幻估值的纸面财富往往会让位于膨胀的自我价值感、嫉妒,以及被资金更雄厚的竞争对手挖角。这些浮华装饰不仅仅关乎个人财富创造,还与实验室的品牌、声望和吸引更多人才的魅力捆绑在一起。而这些装饰可能会变得相当荒谬,比如该实验室办公室健身房里那些印有“Thinking Machines”品牌的杠铃片:


DeepSeek有自己的健身房吗?我不知道。可能有。但我很确定它没有印着品牌的杠铃片。Ilya Sutskever是否希望他能像梁文锋一样自筹资金来运营SSI(迄今已筹集30亿美元)?可能吧。他可能拥有最好的直觉和研究品味,但他无法阻止挖角者——甚至他的联合创始人CEO也被Meta财力更雄厚的扎克伯格挖走了。这并不是说DeepSeek对挖角免疫。其明星研究员之一罗福莉,现在正领导着财力更雄厚的雷军旗下小米的AI工作。

在一个被金钱淹没的行业,以及金钱总是带来的阴谋和戏剧性中,DeepSeek因零外部资金而导致的商业模式缺失,是其唯一持久优势的源泉:为服务于AGI研究而实现的内部最大化对齐,别无其他。

我甚至不确定我是否相信AGI。但作为一名投资者和资本家,我很乐意进入DeepSeek的股东名册。话虽如此,如果DeepSeek曾经让我或任何外部投资者进入,那么让DeepSeek之所以成为DeepSeek的特质,将彻底毁掉,不复存在。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗曾组建反间谍机构 结果最后发现负责人就是以间谍

扬子晚报 浏览 1494

巴基斯坦夜袭阿富汗边境地区 打死至少70名武装人员

新华社 浏览 1905

把孩子气的!某新能源车一配置被小学生投诉,车企一本正经回应了

小李车评李建红 浏览 378

黄景瑜将上太空,官宣成为009号太空游客,乘坐中国自制飞船升空

扒虾侃娱 浏览 1008

营收大增1332.52%,牛散出手增持!下周6股解禁比例超50%

数据宝 浏览 1855

收评:沪指涨超1%逼近4000点 两市放量超3600亿

财联社 浏览 7289

美AI裁员潮,大厂慌不慌?

每日资本论 浏览 1551

疑张亮儿子塌房,留学致女同学怀孕?

观察鉴娱 浏览 1509

10万观众打出9.3分,成本仅3000万,票房破3亿?贺岁档黑马来了

靠谱电影君 浏览 896

何聪睿剧扑甩锅女主,本人发声道歉

扒虾侃娱 浏览 987

雷军们没来,这届广州车展有啥看头?

道哥说车 浏览 1547

伊朗最高领袖重申“将向敌人索赔”

国际在线 浏览 287

奔驰“小G”海外路试谍照曝光

大象新闻 浏览 1350

中国信达“新帅”落定 宋卫刚出任总裁

21金融圈 浏览 1079

雷军跨年直播拆车,15台手机撬动300亿市值?

BT财经 浏览 1091

河南省网络社会组织联合会AI人工智能专业委员会成立

大象新闻 浏览 1317

入秋包包合集!这12个有质感还不撞款!

Yuki女人故事 浏览 1932

消失5个月后泰禾黄其森“归来”

地产深度报道 浏览 1085

携程涉嫌垄断被立案调查 尾盘跳水大跌超6%

Daily每日财报 浏览 988

CBA战报:广厦84-65福建取CBA3连胜,胡金秋22+8+2

懂球帝 浏览 1229

深夜,全线崩跌!发生了什么?

券商中国 浏览 1447
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1