4月8日我拿到了Manus的邀请码,我是从Manus开放注册以来的五个小时内申请的,已苦等了一个多月。
目前Manus貌似只开放了国际版,国内版的话应该是要等上一段时间,Monica在公告里面也说了正在开发以小红书和微信为主登录平台的Manus中文版,到时候应该会全面取消邀请码制度,更加方便用户在小红书和微信等社交平台完成定制型任务,比如说指定旅游路线、烹饪方法和流程等。以下是Manus首页的UI设计情况,看上去还是比较简洁。左边是任务栏(放生成任务用的,我这里的例子是『制作5天内有关机器学习的学习路线,包含精确时间并且安排相应联系』),我生成的这个任务共用了200个credit左右,个人觉得不是很耐用,因为制作学习路线属于比较基础的任务,然而新用户免费的1000个credit在生成基础任务后耗费了大约1/5的credit量。
以下是Manus生成的结果,总共花了大约2-4分钟时间(没有准确计算)。保守考虑Mauns是直接在内置服务器中生成结果的,光看路径的话,是在Ubuntu系统里面直接操作,且大概的操作过程如下:
- 在home的ubuntu文件路径上添加<任务名>的文件夹
- 在<任务名>文件夹中新建todo.md文件,文件此时为空,todo.md是子任务队列首任务
- 通过联网API搜索网络上的多个资料
- 将搜到的资料整理好存在todo.md里面
- 在<任务名>文件夹中,以子任务队列中的第二个任务来命名,生成对应的md文件;第二个子任务跟时间规划有关,则自动生成5day_ml_schedule_formatted.md,命名格式为<具体时间>_<主题>.md
- 优化路径,如果用户用中文提问,会将文件名转成中文
- 最终审查文件中的内容,然后交付给用户
- 生成文档文件,显示在前端中
看得出来,Manus的数据库架构采用了多层级设计,主数据作为中心化管理层(主要是管理用户和元数据,利用分布式关系数据库处理高并发访问和数据一致性),任务级别数据库作为分布式存储层(给每个用户任务创建独立的/home/ubuntu/[任务ID]文件夹作为专属存储空间,在里面直接操作,实际上是一种虚拟机隔离机制策略)。
以下是任务生成参考图:
总结:如果满分10分,直观来看的话,我会给Manus的7分。Manus能够正确分析我给他发的任务命令,懂得如何截获关键词,对关键词进行分块处理和分析,它能将5天机器学习的学习路线按照严格时间规划来安排子任务,附有精确时间,且安排练习,但是这些练习没有任何标注。另外,Manus没有很细致的人机交互功能,对比ChatGPT o4-mini-high的推理功能,o4有比较成熟的人机交互模式,在分析用户发出的任务命令之后会对用户进行再次确认,询问用户一些相关问题,帮用户完善任务命令缺漏,从而降低误解或者生成结果幻听的风险,但是Manus没有此层设计。
(以上为2025年4月结论,Manus在不断迭代更新,部分问题早已解决)
Manus的Agent架构:事件流驱动 + CodeAct
Manus的架构实际上是一个多智能体架构,符合11种MAS方法论中的多种,并且是16种(截止2025年8月)MAS框架之一,具体来说是类似Agno架构。整体架构设计有Planner计划器、Knowledge+Datasource双引擎、文件化记忆、智能交互策略组件、检索与浏览规范、安全执行与部署、工具调用记录表机制,并且遵守CodeAct。
Planner计划器指的是用户输入query之后,Manus会先用一个规划工具将目标拆成编号伪代码式的步骤清单,并同步到todo.md清单里面,然后实时勾选进度。
Knowledge+Datasource是两个不同的引擎,但相辅相成。Knowledge是任务相关的最佳实践和执行建议,主要是由系统注入的,并且配置高置信度。Datasource都是权威API文档和调用示例,优先级最高,能通过API提取数据而不是自己编,真遇到不会的就去搜索。调用API之后会保存调用记录,此模块必须用Python代码调用。另外,只有当API不满足知识索引的情况下才回去做网络搜索。
文件化记忆是所有中间结果都按照规则来写入文件,有两种特性,一是能够复用,下一步直接用,不用重新计算;二是不会出错,长代码或者大表格放在文件里,比放在对话框里面更稳定。
智能交互策略组件是通过Message工具和用户进行沟通的,在不同场景中有不同模式。比如说,notify(非阻塞通知)模式中告诉用户『我收到了』、『任务已开始』或者『当前进度』,不等待回复即可直接继续执行。第二种是ask(阻塞提问)模式,向用户确认关键信息,必须等到用户回答才能继续。第三种是敏感操作人工接管,当步骤有高风险(如支付、删除数据、访问敏感系统)的时候,直接把浏览器或者操作界面交给用户完成,AI在此阶段会暂停等待人工介入完成后再继续工作。
检索与浏览规范指的是Manus在网上找信息的时候,有一套规则:必须进入原文页面,不能只看搜索摘要、必要的时候滚动获取完整信息、信息来源优先级为数据API(datasource)> 网页搜索 > 模型内知识。
安全执行与部署是Manus在沙箱中执行命令和部署服务的时候,也有一套做法。首先,系统用Shell命令加自动确认(-y等参数),避免卡在等待输入阶段中。其次,长结果写在文件里,不塞在聊天框上下文,防止截断或乱格式等问题。第三,代码必须先保存为文件再运行,方便以后复查和复用。最后,Manus支持临时对外暴露沙箱服务(Expose Port)对内容进行验收,并声明临时性。
工具调用纪律机制,指的就是每一步都必须用工具调用返回,在最终结果产出之前禁止直接自然语言回答。
最后还有一个CodeAct,怎么理解呢?简单来说,Manus将『写代码』当做自己的通用语言,它会根据任务要求生成一段Python代码,在云端沙箱里面执行,观察运行结果,在根据反馈自我调试,并且重复迭代。这种方式让Manus多智能体系统不在局限于预设的功能列表,而是像操作一个电脑操作系统,既能处理数据、生成可视化图表,还能调用复杂库、运行脚本、临时部署在线任务,实现了『想到就能做到』的功能。
待更新内容:
- Manus使用的文件IO处理策略
- Manus的数据库分布策略
- Manus与开源项目OpenManus、Anus等真的一样吗?