关闭广告

上海AI实验室开源书生万亿科学大模型Intern-S1-Pro

IT之家1650人阅读

IT之家 2 月 4 日消息,上海 AI 实验室今日(2 月 4 日)宣布开源基于“通专融合”技术架构 SAGE 打造的万亿参数科学多模态大模型 Intern-S1-Pro


上海 AI 实验室表示,作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro 的核心科学能力实现了跃升,高难度综合学科评测稳居 AI4S 领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。


该模型基于混合专家架构(MoE),共拥有 512 个专家,总参数达 1T,每次调用仅激活 8 个专家、22B 参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:

  • 在 SAGE 的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;
  • 通过高效路由机制,系统攻克了训练万亿参数 MoE 模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了工程基础。

与此同时,Intern-S1-Pro 验证了从原创模型架构到国产算力基座自主技术的完整链路,为构建开放共享的 AGI4S 基础设施奠定了底座。

IT之家附 Intern-S1-Pro 开源地址如下:

  • 在线体验链接:https://chat.intern-ai.org.cn/
  • GitHub 链接:https://github.com/InternLM/Intern-S1
  • HuggingFace 链接:https://huggingface.co/internlm/Intern-S1-Pro
  • ModelScope 链接:https://www.modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1-Pro
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

E句话| 路行退出《再见爱人》?

仙女事件簿 浏览 2637

当智能体爆发在即,数据库如何成为“发动机”?

科技行者 浏览 1881

医生+教师“王炸”组合IPO!海圣医疗为千家医院供货年入3亿

野马财经 浏览 2489

中国斡旋泰柬停火后又单独援助柬方 鲁比奥作奇怪表态

时时有聊 浏览 7099

蒋凡重启阿里:一场AI重构内核的千亿实验

博望财经 浏览 2674

智己汽车2025全年销售81,017台 创历史新高

网易汽车 浏览 1933

每月抽查5%商家 外卖平台“新国标”落地

北京商报 浏览 2153

奇才120-103尼克斯,巴格利18+11,亚布塞莱11分,克拉克森12分

懂球帝 浏览 2740

金靖靠卖笑成名却被宋丹丹嫌弃?

小椰的奶奶 浏览 2383

网友预约26元深夜上门开锁结果被收1300元 商家回应

潇湘晨报 浏览 9607

谁的自动驾驶算法更厉害?这场比赛在京沪同步开赛,定义未来出行安全边界

文汇报 浏览 2029

闻泰科技回应:个别外籍高管试图颠覆公司治理结构

澎湃新闻 浏览 11493

随着北京险胜,辽宁大胜,CBA最新积分榜:前四皆9胜2负 排名有变

侃球熊弟 浏览 1906

国外产子,知三当三,江疏影传闻哪个是真的

黔乡小姊妹 浏览 595

赵建:货币苏醒

首席经济学家论坛 浏览 2726

或搭载激光雷达 长城硬派越野车谍照曝光

车质网 浏览 2006

全系标配激光雷达 东风奕派eπ007+预售14.99万起

网易汽车 浏览 2496

TA:皇马正与苹果合作开发VR项目,但一切处于非常早期的阶段

懂球帝 浏览 2541

黄磊宣传乌镇用力过猛!戏剧节变夜店蹦迪现场,明星狂欢惹争议

萌神木木 浏览 2519

A股特高压拉升!AI算力引爆电力刚需,巨头订单排至2027年

览富财经网 浏览 1638

男子在狱中病亡14年后获宣告无罪 家属上坟:平反了

澎湃新闻 浏览 6031
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1