实现真正 DeFai 愿景的道路充满挑战,需要攻克单体 AI 模型能力上限、多模态交互协作的原子性保障、多模态系统资源调度与支配、系统容错与故障处理机制等一系列复杂难题。
一夜之间,许多朋友纷纷向我推荐 #manus,称其为全球首款真正通用的 AI Agent,能够独立思考并规划执行复杂任务,最终交付完整成果。这一概念听起来令人兴奋,但除了引发朋友圈中关于失业焦虑的讨论外,manus 究竟能为 web3 DeFai 场景带来怎样的变革?以下,我将分享我的思考。
一个月前,OpenAI 推出了同类产品 Operator,AI 可在浏览器中独立完成餐厅预订、购物、订票、外卖订餐等任务,用户可实时可视化监督,并随时接管控制权。然而,这套 Agent 并未引起广泛讨论,原因在于其单一模型驱动的工具调用框架,用户若意识到关键决策仍需人工干预,便失去了依赖其执行任务的意愿。
manus 表面看似与 Operator 类似,只是应用场景更为丰富,涵盖简历筛选、股票研究、房产购买等,但背后框架与执行系统的差异却十分显著。Manus 由多模态大模型驱动,并创新性地采用了多重签名系统。简而言之,AI 模仿人类执行(计划-执行-检查-行动)的 PDCA 循环,将由多个大模型协同完成,每个模型专注特定环节,既能降低决策风险,又能提升执行效率。所谓「多重签名系统」,实则是一种多模型协作的决策验证机制,通过要求多个专业模型的共同确认来确保决策与执行的可靠性。
通过对比,manus 的优势逐渐显现,视频 Demo 中展示的操作体验更让人印象深刻。但客观而言,manus 对 Operator 的迭代创新尚属起步阶段,尚未达到颠覆性革命的程度。关键在于执行任务的复杂度,以及非统一标准用户 input Prompt 进入后大模型的容错率与交付结果成功率。若顺着这一创新思路,web3 的 DeFai 场景是否就能迅速成熟应用?显然,现实并非如此。
例如,在 DeFai 场景下,Agent 执行交易决策时,需要一个 Oracle 层 Agent 负责链上数据收集与验证,整合分析数据,并实时监控链上价格以捕捉交易机会。这一过程对实时分析能力要求极高,可能存在一秒前还有效的交易机会,但等到 Oracle 大模型传输给交易执行 Agent 时,机会已消失(套利窗口)。这暴露了多模态大模型在执行决策时的最大软肋:如何联网、触链调取 Real-Time 级别的数据,并从中分析出交易机会,进而完成捕捉。联网环境尚可,许多电商网站订单价格并非实时变动,不易引发系统动态平衡问题,但在链上,这一挑战却无处不在。
因此,整体而言,manus 的出现确实会在 web2 领域引发一波朋友圈焦虑,毕竟许多重复性高的文职和信息处理工种可能面临被 AI 取代的风险。但让他们焦虑的是另一回事。在 web3 对 DeFai 应用场景的推动作用上,我们需客观认识:
必须承认,其意义确实重大。毕竟,manus 提出的 LLM OS 以及 Less Structure more intelligence 理念,尤其是多重签名系统,将为 web3 拓展 DeFi 与 AI 的结合提供诸多启示。这纠正了大部分 DeFai 项目的重大误区——不要试图依靠单一大模型实现 AI Agent 的自主思考与决策等复杂目标,这在金融场景下根本不切实际。
真正 DeFai 愿景的实现,需要解决单体 AI 模型能力上限、多模态交互协作的原子性保障、多模态系统资源调度与支配、系统容错与故障处理机制等一系列复杂问题。例如:
– **Oracle 层 Agent**:负责收集链上数据与分析,监控价格,形成有效数据源;
– **决策层 Agent**:根据 Oracle 提供的数据进行分析与风险评估,制定决策与行动方案;
– **执行层 Agent**:根据决策层给出的多种方案,结合实际情况执行,包括 gas 费用优化、跨链状态、交易排序冲突等。
唯有这一系列 Agent 都足够强大,并有一个庞大的系统框架落定,真正的 DeFai 革命才会到来。
本文网址:http://www.idea2003.cn/news/545.html