关闭广告

测Manus 1.5:丝滑,超预期,Manus独特上下文工程的一次关键展示

硅星人1938人阅读


作者 | 周一笑
邮箱 | zhouyixiao@pingwest.com

过去半年多保持低调的Manus,进行了一次值得关注的更新,Manus直接从1.0版本跨越到1.5,中间没有经历小版本发布,团队似乎在憋一个大招。

事实是Manus团队花了7个月时间专注于架构级改进,最终交出了Manus1.5,根据官方数据任务完成速度提升近4倍,从平均15分钟缩短到不到4分钟;任务质量提升15%,用户满意度提高 6% 。

根据官方的介绍,Manus1.5版本最大的亮点在于全栈Web应用开发能力。现在你可以通过对话来构建和部署生产级Web应用,包括后端服务器、数据库、用户认证系统、自定义域名、内置分析,甚至版本控制,所有这些都不需要离开Manus平台。此外,新增的协作功能和 Library 资料库,让团队可以在同一空间共享会话、版本和资产。

作为一个曾经测试过多款AI Coding工具的用户,我对“AI 生成网站”这类功能早已不陌生。当我看到据传是有人用Gemini 3.0复刻macOS的演示后,我决定用Manus 1.5来试试,看它能做到什么程度?

1

实测:一句话,十分钟,复刻MacOS


更新后的Manus1.5可以切换1.5和1.5 Lite,免费用户只能使用Lite。我们选择Manus 1.5来进行测试。

输入Prompt:帮我做一个网页版的复古 Mac OS 桌面。 1、外观风格:要像经典的 Mac OS 9 系统,有标志性的顶部菜单栏和可以拖动的窗口。 2、内置软件:桌面需要包含三个基本软件:一个可以打字的“记事本”,一个能用 AI 画画的“AI 画家”,以及一个“计算器”功能。 3、账户系统:这个网站必须有账户系统。

开始测试,可以看到Manus的界面没什么变化,左边是对话框,右边可以看Manus操作云电脑的过程、预览代码和项目。


输入指令之后,Manus没有问我更多问题,它的第一步是初始化全栈Web项目,搭建后端、数据库和账户系统。像一个专业工程师那样,先打好地基再盖房子。


接着Manus开始设计系统架构和技术方案,并且创建了一个DESING文件。从技术栈、数据库表,到UI细节,甚至可能的技术挑战都提前想好并给出了解决方案。



然后就是开发过程,有点像进入了心流状态的程序员,开始了没有中断的开发,它会自己安装依赖包、重启服务、修正代码中的类型错误。

大概10分钟后,它交作业了!


从视觉上看,Manus确实抓住了一些精髓。标志性的青色桌面背景、顶部的菜单栏、以及三个小巧的应用图标,都颇有几分经典Mac OS 9的神韵。同时好像也抓住了一些Windows复古界面的味道。


不过,看起来不错是一回事,真正能用又是另一回事。我们来试试三个内置的应用:记事本、AI画家和计算器

在测试过程中,我发现这个os像真正的桌面系统,是支持多窗口的,并且各个应用的窗口都可以流畅的点选、拖动和关闭,毫无“网页感”。


最基础的记事本开始,我测试了新建文档,编辑内容,保存这些基本功能都没有问题。


然后是计算器,只有基础的加减乘除,且只能顺序计算,经过测试没有问题。


最后是难度最高的,加入了AI功能的“AI画家”应用,我们来画一只猫咪坐在月亮上。


完全超出预期的真能生图,输入的Prompt中我把“一只”打成了“一直”,不过不影响生成效果,it just work!


注意这里我是没给Manus提供api的,应该是就像Manus在design.md文件里写的,调用了Manus Built-in Image Generation API。只是不知道消耗的token算谁的,扣积分吗?

生成的图片长这样:



关闭后重新打开应用,生成的记录能够正常保存。


接下来测试一下账户系统。默认是登陆状态,我们点击右上角的登出,就进入到了登陆界面。


点击登陆,可以看到它是具备账号系统的,powered by Manus。这个系统应该是直接使用了Manus内置的系统,功能非常完善。


测试一下是否可以用其他账号登陆。我们用一个新的邮箱注册,邮箱顺利收到了验证码,并且成功注册登陆。


登录后,看到的是一个全新的桌面。我在里面进行了几次操作,然后登出,再用第一个账号登录回来,之前的所有历史记录都保存了,两个账户的数据是隔离开的。

应用测试和功能测试都通过了验收,下一步可以选择发布这个网页版的复古版的Mac OS,也可以继续对项目进行修改,Manus还提供了一些推荐追问。这里我们选择发布。


Manus为这个项目生成了一个网页链接,有兴趣的同学可以点击体验:https://retromacos-cnt7elud.Manus.space

1

开始接近“靠谱”的Agent

这次Manus1.5的发布中,官方宣传的一个点是“无限上下文”,这里的无限不是物理上的无限token窗口,而是指通过可逆压缩、结构化摘要、依赖文件系统的快速卸载与检索以及分层动作空间等多种策略,使得Agent能够长期运行,有效管理超长的任务。

在 LangChain 与 Manus 团队的深度访谈中,团队解释了他们的“上下文工程”策略,通过可逆的“压缩”(剥离可重构信息,只保留路径)和不可逆的“摘要”(用结构化模式提取关键信息),再配合上下文卸载到文件系统,让 Agent 可以长期运行而不会因为上下文过长导致“上下文腐败”。这也解释了为什么我这次测试的 macOS 复刻能够流畅完成几十个步骤。


Manus创始人肖弘提到,他们选择的是先构建强大的通用内核,让各种场景自然涌现的路径,“Manus 首先是一个 Agent architecture,然后才是一个产品”。对于一家创业公司来说,不做基础模型,而是把精力放在工程、架构和产品打磨上,做出顶尖的 Web 开发能力,这本身就证明了在 AI 时代,创业公司依然可以通过工程创新找到位置。

最后,坦白说,现阶段的大多数“一句话生成”类 AI Agent产品,对大部分用户来说更多还是做玩具、做Demo的阶段。至少从这次体验来看,Manus 1.5 算是把“玩具”这件事做的更进一步了,整一句Prompt,产出的完成度让人惊艳。当然它也不完美,比如一直被吐槽的积分消耗快这些槽点都存在,以及我们这次没有加入更复杂的测试。但关键在于方向,如果 AI Agent 能从偶尔能用进化到基本靠谱,那距离它真正改变我们的工作方式就不远了。


点个爱心,再走 吧

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

欧盟高官:美国对格陵兰岛的威胁“极其令人担忧”

国际在线 浏览 1043

芦哲:经济“温差”如何影响宏观调控?

首席经济学家论坛 浏览 1895

我们为什么需要节日穿搭?

时尚COSMO 浏览 1269

切尔西本赛季英超已有10人取得进球,与阿森纳并列最多

懂球帝 浏览 1692

横琴人寿去年净亏3.27亿,保险业务收入同比下滑23%

密探财经 浏览 858

入秋包包合集!这12个有质感还不撞款!

Yuki女人故事 浏览 1934

媒体:高市早苗胆子挺肥要住有名凶宅 安倍晋三都不敢

新民晚报 浏览 4527

速览!假期这些大事影响节后市场

Wind万得 浏览 590

斯洛特:尽管我们取得四连胜,但球队的表现并不完美

懂球帝 浏览 1162

卡帕西8000行代码手搓ChatGPT,成本仅100美元,手把手教程来了

量子位 浏览 2045

陈乔恩带老公和父母聚餐,Alan负责拍照

黄谋仕 浏览 1070

檀健次恋爱风波越演越烈!本人日本上学经历被扒,全家被质疑亲日

萌神木木 浏览 1092

英伟达推出智驾AI大模型 马斯克泼“现实冷水”

网易汽车 浏览 1096

比特币暴跌超20%!43万人爆仓,加密货币市场一片“哀嚎”

北京商报 浏览 1664

为新能源再投10亿,苹果为何还不造车?

BT财经 浏览 1898

巴黎小将博利首次代表一线队出场却上半场就伤退,含泪离场

懂球帝 浏览 1309

BBA的心态,快被华为搞崩了

少数派报告Report 浏览 1301

245万的房子被中介私自标价170万挂牌 浙江业主怒了

FM93浙江交通之声 浏览 7586

明年上市 金标大众首款轿车 与众07申报信息发布

网易汽车 浏览 2019

以总理办公室:已确定加沙“和平委员会”总干事人选

国际在线 浏览 1013

1999元起 华为畅享70X尊享版开售:麒麟8000芯片、一键发送北斗卫星消息

快科技 浏览 1408
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1