实测Manus:我用它生成了10个邀请码……好玩但崩溃
发布时间:2025-03-07 16:30:21| 浏览次数:
今天凌晨刚刚发布的Manus有多震撼人心,已不需要赘述了:较高程度的独立思考能力,强大的复杂任务解决能力,以及可靠的交付效果。
和纯粹的对话式AI产品相比,Manus话少,不止于思考,还能干活;和传统虚拟助手相比,Manus的分解、规划和解决问题能力(通过computer use和编程能力体现)更高。
目前具体细节还很有限,但我们通过公开资料了解和猜测,Manus的背后有不同agent各自处理单项任务,agent的任务进度同步和转移通过API执行。
作为产品的Manus,是一个多模型、多独立Agent的缝合体——而团队也通过“套壳”的自黑表述承认了这一点。但这并不能消解Manus作为一个成型的,远高于最小可行水平的产品的意义。
Manus让人机交互的范式,升级为人机协作,比其它同类选手更接近真正意义上的通用AI Agent。
APPSO也用Manus进行了实测,但由于任务用时较长,后面又遭遇网站登录困难的情况,所以只完成了几个简单的任务,其它任务恰逢Manus系统超负载,没能进行下去。
与此同时,Manus项目方也发出了一份官方回应,表示准备服务器资源不足,导致用户体验较差。
和很多人一样,我们经常会对日新月异的AI技术和五花八门的AI工具感到困惑。于是我向Manus提出了这个请求:
从Manus返回的初步结果看,它先搜索了一些AI资讯门户式的网站,应该是先掌握大概的分类方式,确认表格的分类维度,然后再分门别类地去找对应的AI工具,查询资料。
它找到了17个类别——正在看文章的读者,如果你也不知道这些AI工具该怎么分类,可以参考Manus的思考结果了:
在联网搜索过程中,Manus偶尔会遇到浏览器故障的情况。不过没关系,它会自行处理这些错误,重试或继续下一项任务。
但是没过多久,它还是崩溃了。这一天当中,我们从APPSO读者搜集了十几个任务请求,喂给Manus,结果也是一样的:高系统负载导致了内部服务器错误,请稍后重试或创建一个新的对话。
使用Manus的过程,也是直接近距离观察它的思考路径、工作流程的,一次难得的机会。
想有一个游戏,在里面扮演一个科技创业者,历经艰难险阻,克服重重危机,将公司打造为全球科技龙头,改写人类历史?
有人做了这么一个谷歌CEO模拟器,带你体验谷歌历史上的重要决策,重走从车库出发,直到成为科技巨头的传奇之路。
游戏将谷歌的公司历史分为了5个关键发展阶段:创业、成长(pre-IPO)、扩张、多元化、重组更名(Alphabet阶段)。在每一个阶段,游戏都给玩家提供了多个关键抉择,每个都将影响公司的发展方向、资源分配,以及最终的成就。
更有意思的是,它还特别加入了一些在经营类游戏里常见的“突发随机事件”,来考验玩家作为谷歌CEO的危机处理能力。
APPSO的读者恐怕对现实世界里的谷歌足够熟悉了,不妨跟我一起来一场抽象离谱的大冒险?
困难模式,初始资金$80,000,我通过联合创始人的女朋友,租用了她姐姐的车库,创办了Google。初期我们的技术实力一般,其它各方面要素都十分匮乏——但好在,我们在大学期间研究搜索引擎项目“搓背”(BackRub)已经初具雏形,特别是里面的PageRank算法,很有潜力。
我们拿到了第一笔天使投资,但这笔钱究竟应该怎么用?是继续优化PageRank,还是换个宽敞点、有空调的办公室,抑或干脆去美国在线(AOL)上买点广告来做推广?
搜索引擎靠什么活着,不就是广告嘛?舍不得儿子套不着狼,想卖广告当然要先买点广告。我直接把钱全扔在广告上了。
获得了一些用户,然而刚刚略微提升的品牌声誉,就因为突然发生的重大安全漏洞而掉下去了。着急忙慌地修完了bug,我又面临了选择商业模式、引入外部投资者、如何拓展分支业务等一连串难题。
当我在这边焦头烂额,我的员工却在上班时间里捣鼓自己的项目,说要做什么“Gmail”。
这怎么行?邮件里怎么卖广告?不是跟我的核心模式背道而驰了吗?直接解雇他,必须all in搜索。
这妨碍了我专心卖网站广告,但移动互联网的浪潮确实不可抵挡。我们可以继续在新操作系统里寻找机会植入广告,听说有一家中国的手机公司很擅长做这个——我们不跟它合作,也不跟任何公司合作,而是直接自己做自己的手机。
并且要封闭,要垂直整合,要多放广告。只有围墙里的花园才是最美丽的花园。我叫它Nexus。
虽然经过一番操作,公司账上只有9万美元,但我还是决定全面进军中国市场,拥抱人口红利。
看到Facebook上市,我没有心动,而是从微软招来了一名爱将Vic Gundotra,授权他全力研发Google+。我们将all in社交媒体!
目前账上有8万美元——没亏就是赚。我们做了大量的收并购,特别是一家名叫DeepMind的公司,非常火。我决定这次all in AI。当然,广告仍然是核心,只是我们不说。
最终,我的Google CEO之旅还是结束了。也许我的一系列的操作,导致董事会终于失去了信任。我离开了这家奉献了20多年青春的公司,留下了还不错的技术实力,少而精的用户基础,轻松自由的组织管理文化,以及略高于电诈园区的品牌声誉。
刚才的游戏过程,确实多半是我在故意整活。不过这个模拟器虽然很简单,还是设计很全面的,有剧情,有选项,有资源表,有大事记。作为一个小游戏,一个小品级的产品,它已经很完整了,体现出的想象力很丰富。
Google公司运营模拟器,玩家将扮演谷歌ceo,体验谷歌历史上重要的公司决策,让用户过瘾的同时,也能了解谷歌的历程,启发用户思考公司决策,互动式的文字游戏
我们可以通过重放过程看到它的思考、分解任务、执行子项任务、最终汇总和生成结果的全部过程:
Manus简单地回答了用户自己将要做什么,紧接着打开了一个Ubuntu虚拟机,直接开始分解具体任务,编写了一个基于todo.md文件的任务清单。
首先,Manus先去做了大量的搜索,包括谷歌创始人/CEO是谁,历史上的关键产品,重要的收购纪录以及近年来的商业模式和战略转变等大量的资料,并且浏览了包括谷歌官网、维基百科、中英文新闻网站、知乎等等。
通过这些资料的学习,九游娱乐(NINEGAME)Manus对谷歌已经有了一个八九不离十的认识,可能并不深度,并不独到,但并没有太多事实出入。
而如果用户觉得它自动搜索的资料不够全面,想加一点独特的味道,完全可以做到:
在执行过程中,用户随时点击这个按钮,手动增加知识内容。Manus在生成的过程中,仍然会时不时回来复习一下这些资料。
在执行任务的每一步骤,Manus也都会用正确的语言(中文完全支持),向用户解释自己刚才做了什么,获得了哪些收获,而接下来要做什么。这应该归功于它在分解任务时候做的类似于to-do list一样的文件。
这显示Manus很聪明。但值得注意的是,任何一个缺乏专业能力的用户——特别是Manus目前所体现出的数据挖掘、整理,以及编程等能力——也能够从Manus完整展示的工作流程中,九游娱乐(NINEGAME)提升自己的能力。
大家都在吐槽泽连斯基在白宫表现糟糕,但你上你行吗?不要光说不练,来试试这款Manus官方测试的小游戏:泽连斯基白宫辩论模拟器!
中文:最近,泽连斯基、万斯和特朗普在白宫的激烈交锋引起了广泛关注。你能否开发一个简单的互动模拟游戏,让我在辩论中扮演泽连斯基?我对能再现这一政治场景的互动游戏很感兴趣。
直到玩家测试步骤,之前的全部工作都由Manus在虚拟机上自动完成,不需要用户做出任何控制。同样,在任务的关键节点上,Manus都会特别解释自己做了什么。
Manus介绍,自己设计了三种结局,在游戏结束后会给玩家提供一份完整记录。游戏过程中有强硬
(conciliatory)这三种对话选项供玩家选择,NPC会对不同风格的表述产生不同的“情绪”,直接影响结局走向。而这正是《天国拯救》、《巫师》等游戏最流行的设计理念:choose your own adventure,选择你自己的冒险。
在我的试玩中,我尝试代入了一个身处政治外交和军事漩涡的政治家,在家国被割据的屈辱,和国际政治谈判舞台所期待的外交身段之间,试图在刀尖上找平衡。
我两度导致特朗普失望和遭到万斯的怀疑,但所幸在特朗普的最后通牒时刻,还是把场面救回来了。虽然我的谈判没有达成直接的实质性的结果,至少我没被轰出白宫……
虽然只有6个回合,因为可选项设计的有意思,剧情多样,我又玩了几次。可能因为性格太懦弱,有一次甚至谈成了。
你可以在Manus官网的Use Cases-WTF一栏,找到这个模拟游戏。跑完会话回放之后,在它的最后一条回复里面找到游戏的链接。或者你也可以直接访问这个地址:
从Manus发布,爆红,到现在一码难求,网站登录访问困难,团队对外道歉,只用了十几个小时的时间。
APPSO在Manus发布之初就做了报道,给了一个相对正面的评价。而经过了更加深入的试玩,我们提炼出这个产品的优点:
无论在使用过程中,还是事后重放,都能够比较完整地展示模型是如何思考的,任务是怎样被拆解和指派的,每一个步骤都可以追溯。
这既是一种提高AI可解释性的实践,同时也给用户一个通过模仿它来自我提升成长的机会。
Manus结合computer use能力打开虚拟机,解压用户上传压缩包,遍历25份简历,提取并记忆25组复杂信息;再将它们整理到一个Excel表格当中,进行打分排名,充分列举了包括资历、技能水平、项目经验、关键成就在内的多个指征,却不单独依赖特定一项。
在过去,同类的工作在过去可能需要用户用一个AI Agent工具,多次分步输入指令,或者需要用户自己用多个工具来分别完成任务再自行组合,无论怎么做都很麻烦。而Manus的自动化程度,超过了包括Claude在内的同类方案。就算你坚信Manus的能力没有提升
综上各点,Manus确实超过了过去一段时间以来我们对AI工具的体验认知。如果说以前的Agent更多只是没“脑子”的工具,Manus已经非常接近一个有“脑子”的AI助手,
但与此同时,我们今天看到了不少过于吹捧的自媒体报道,跟着Manus团队一起提前“高潮”了,称其“AGI的里程碑”;当然,也不乏有人指出其产品“套壳”,团队人物存在“黑历史”,技术栈和实现方式缺乏真正的自主创新。
我们应该批评Manus什么?毫无疑问,它的营销方式并不“体面”:找了一批自媒体来做内部分享,号称“只是发一个demo”,以没准备好应对用户爆炸的服务器资源为说辞,制造一种营销的“高潮”,随后又对外界封锁,使得人们难以探知真相,满足好奇心。
但我想,无论这个产品以公测还是正式发布的方式,向公众完全开放之前,一切的维护和贬损都没有太大意义。
AI技术突飞猛进,早已离开了学术科研的襁褓,和大公司的封锁。企业航母all in AI难保一帆风顺,小公司却完全可以只用一周时间起飞。现有的开源、半公开,付费、收费的工具比比皆是,只要不违反相应的开源许可证规则和商业授权协议,任何人都可以充分且自由地利用它们,无论出于纯粹的个人使用,还是做拼装组合叠加的“套壳”式创新。
,作者:appso本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 如对本稿件有异议或投诉,请联系