DePIN机器人技术瓶颈与未来突破:挑战与机遇解析

DePIN机器人技术瓶颈与未来突破:挑战与机遇解析

DePIN机器人技术正面临哪些挑战?扩展去中心化机器人的主要障碍是什么?

引言:2月27日,Messari举办了一场关于“构建去中心化物理人工智能”的播客,邀请了FrodoBot Lab的联合创始人Michael Cho。他们深入探讨了去中心化物理基础设施网络(DePIN)在机器人技术领域的挑战与机遇。尽管该领域尚处萌芽阶段,但其潜力巨大,有望彻底重塑AI机器人在现实世界中的运作模式。然而,与依赖海量互联网数据的传统AI不同,DePIN机器人AI技术面临更为复杂的难题,包括数据采集、硬件限制、评估瓶颈以及经济模式的可持续性。本文将剖析此次讨论的核心要点,揭示DePIN机器人技术遭遇的困境,解析扩展去中心化机器人的主要障碍,并阐述为何DePIN相较于中心化方法更具优势。最后,我们将展望DePIN机器人技术的未来,探讨其是否即将迎来类似“ChatGPT时刻”的突破性进展。

DePIN智能机器人的发展瓶颈

Michael Cho在创立FrodoBot之初,最困扰他的便是机器人技术的成本问题。当时市面上商用机器人价格高得令人咋舌,严重制约了AI在现实世界中的应用推广。他的最初解决方案是打造一款售价仅500美元的低成本自主机器人,意图以价格优势抢占市场。但随着研发的深入,Michael意识到,成本并非真正的瓶颈。DePIN机器人技术面临的挑战远比“贵不贵”更为复杂。随着FrodoBotLab的持续推进,DePIN机器人技术的多个瓶颈逐渐浮出水面。若要实现大规模部署,以下这些瓶颈必须被逐一攻克。

瓶颈一:数据采集难题

与依赖海量互联网数据训练的“线上”AI大模型不同,具身化AI(embodied AI)需要与现实世界直接互动才能发展出真正的智能。然而,目前全球尚未形成大规模的基础设施来支持这种数据采集,且业界对于如何收集这些数据仍缺乏共识。具身化AI的数据采集主要分为三大类:

第一类是人类操作数据,即人类手动控制机器人时产生的数据。这类数据质量极高,能够完整捕捉视频流和动作标签——也就是人类观察到的环境与相应的反应。这是训练AI模仿人类行为的最佳方式,但缺点是成本高昂且劳动强度大。

第二类是合成数据(模拟数据),这类数据对于训练机器人在复杂地形中移动尤为有用,例如训练机器人在崎岖地面上行走,对特定专业领域具有显著价值。然而,对于变化多端的任务,如烹饪,模拟环境往往难以覆盖所有真实场景。以训练机器人煎蛋为例:锅的类型、油温、房间条件的细微变化都会影响结果,而虚拟环境很难模拟这些复杂因素。

第三类是视频学习,即让AI模型通过观察现实世界的视频来学习。虽然这种方法具有潜力,但它缺乏智能所需的真正物理互动反馈,难以实现深度学习。

瓶颈二:自主性水平提升困境

Michael回忆,他首次在现实世界测试FrodoBot时,主要应用于最后一英里的配送任务。从数据上看,结果还算理想——机器人成功完成了90%的配送任务。但在现实生活中,10%的失败率是不可接受的。一个每十次配送就失败一次的机器人,根本无法商业化。这与自动驾驶技术类似:无人驾驶即使拥有万千次成功驾驶记录,一次失败也可能彻底摧毁商业消费者的信心。

因此,要让机器人技术真正实用,成功率必须接近99.99%甚至更高。但问题是,每提高0.001%的准确率,都需要付出指数级的时间和精力。许多人低估了这最后一步的难度。Michael曾于2015年乘坐谷歌的自动驾驶汽车原型,当时他坚信完全自动驾驶即将实现。十年过去,我们仍在探讨何时能达成Level 5的完全自主性。机器人技术的进步并非线性,而是指数性质的——每前进一步,难度都会大幅增加。这最后的1%准确率,可能需要数年甚至数十年的持续努力才能实现。

瓶颈三:硬件限制亟待突破

退一步讲,即使AI模型再为先进,现有的机器人硬件也尚未准备好实现真正的自主性。在硬件方面,最容易被忽视的问题是触觉传感器的缺乏——目前最先进的技术(如Meta AI的研究成果)仍远远达不到人类指尖的敏感度。人类依靠视觉和触觉与世界互动,而机器人对纹理、抓握和压力反馈几乎一无所知。

此外,遮挡问题同样严峻——当物体部分被遮挡时,机器人很难识别并与之互动。而人类即使看不到物体的全貌,也能凭借直觉理解它。除了感知问题,机器人执行器本身也存在缺陷。大多数仿人机器人将执行器直接置于关节上,导致它们笨重且存在潜在危险。相比之下,人类的肌腱结构使动作更平滑、更安全。这就是为什么现有的仿人机器人看起来僵硬且不灵活。像Apptronik这样的公司正在开发更具生物灵感的执行器设计,但这些创新仍需时间成熟。

瓶颈四:硬件扩展面临资本挑战

与仅依赖计算能力的传统AI模型不同,智能机器人技术的实现需要在现实世界中部署物理设备。这带来了巨大的资本挑战。制造机器人成本高昂,只有最有钱的大公司才能负担得起大规模实验。即使是最高效的仿人机器人,目前成本也高达数万美元,大规模普及根本不现实。

瓶颈五:评估有效性的难题

这是一个“隐形”瓶颈。以ChatGPT为例,这类线上AI大模型几乎可以瞬间测试其功能——一个新语言模型被发布后,全世界的研究人员或普通用户通常在几小时内就能对其性能优劣得出结论。但评估物理AI则需要现实世界的部署,这需要时间。特斯拉的全自动驾驶(FSD)软件就是个典型例子。如果特斯拉记录了100万英里且没有事故,这是否意味着它真的达到了Level 5自主性?1000万英里呢?机器人智能技术的问题是,唯一验证它的方法就是观察它最终在哪里失败,也就意味着需要大规模、长时间的实时部署。

瓶颈六:人力不可或缺

另一个被低估的挑战是,在机器人AI开发中,人类劳动力依然不可或缺。光靠AI是不够的。机器人需要人类操作员提供训练数据;维护团队保持机器人的运行;以及必不可少的研究人员/开发人员持续优化AI模型。与可以在云端训练的AI模型不同,机器人需要持续的人类干预——这也是DePIN必须解决的一个主要挑战。

未来展望:机器人技术的“ChatGPT时刻”何时到来?

有些人认为,机器人技术的“ChatGPT时刻”即将到来。Michael对此持谨慎态度。考虑到硬件、数据和评估的挑战,他认为通用机器人AI距离大规模采用还很遥远。不过,DePIN机器人技术的进展确实让人看到了希望。机器人技术的开发应该是去中心化的,而不是由少数大公司控制。一个去中心化网络的规模和协调性能够分散资本负担。与其依赖一家大公司出钱造数千台机器人,不如将可以贡献的个人纳入到一个共享网络中。

以数据收集和评估为例——不用等一家公司部署有限的机器人收集数据,去中心化网络可以以更大的规模并行运行、收集数据。例如,在最近一次阿布扎比的一场AI与人类机器人竞赛中,来自DeepMind和UT Austin等机构的研究人员将他们的AI模型与人类玩家进行了测试。虽然人依然占上风,但研究人员对从现实世界机器人互动中收集的独特数据集感到十分振奋。这从侧面证明了对连接机器人技术各个组成部分的子网的需求。研究界的热情也表明,即使完全自主性仍然是一个长期目标,DePIN机器人技术已经从数据收集和训练到现实世界部署和验证方面展示了切实的价值。

另一方面,AI驱动的硬件设计改进,如用AI优化芯片和材料工程,可能会大大缩短时间线。一个具体的例子是FrodoBot Lab与其他机构合作,确保了两盒NVIDIA H100 GPU——每盒都包含八个H100芯片。这为研究人员提供了必要的计算能力,用来处理和优化从机器人部署中收集的现实世界数据的AI模型。如果没有这样的计算资源,即使是最有价值的数据集也无法充分利用。可见通过DePIN去中心化计算基础设施的访问,机器人技术网络可以让全球的研究人员在不被资本密集的GPU所有权所限制的情况下训练和评估模型。如果DePIN能成功众包数据和硬件进步,机器人技术的未来可能会比预期更早到来。

此外,像Sam这样的AI代理(一个带有meme币的旅行KOL机器人)展示了去中心化机器人技术网络的新盈利模式。Sam自主运行,24/7在多个城市直播,而它的meme币也在增值。这种模式展示了由DEPIN驱动的智能机器人如何通过去中心化所有权和代币激励来维持自身财务。未来,这些AI代理甚至可以用代币支付人类操作员的协助、租用额外的机器人资产,或者竞标现实世界的任务,从而形成一个既有利于AI开发又有利于DePIN参与者的经济循环。

总结

机器人AI的发展不仅取决于算法,还涉及硬件升级、数据积累、资金支持以及人的参与。过去,机器人行业的发展受限于高昂的成本和大型企业的主导地位,使得创新速度受阻。而DePIN机器人网络的建立意味着,借助去中心化网络的力量,机器人数据收集、计算资源和资本投入可以在全球范围内协同进行,不仅加速AI训练和硬件优化,还能降低开发门槛,让更多研究人员、创业者和个人用户参与进来。我们也期待,机器人行业不再依赖少数科技巨头,而是由全球社区共同推动,迈向真正开放、可持续的技术生态。

本文网址:http://www.idea2003.cn/news/1743.html

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注