一年一度的机器人春晚——世界机器人大会(WRC2024)已落下帷幕。
本次世界机器人大会共有169家机器人领域企业参展,与智库智库智源会、上海世界人工智能大会类似,也是人潮涌动。
展厅内人头攒动,大大小小的机械臂、灵巧手在空中挥舞,轮式、四足、人形机器人演示着各种作业。
人形机器人分类物品时出错,视频加速5倍
但在喧闹的表面之下,我们依然发现展厅里存在着一些质疑和争议。
“人形”是最大的不共识。
尽管展厅里随处可见人形机器人,但全球机器人界绝对大佬——波士顿动力公司创始人马克在发布会上坦言,对人形机器人行业非常悲观。
他认为,工业机器人已经非常成熟,具备商业化的能力,而人形机器人目前“某种程度上还是一种展示形式,而不是一种生产力”。
波士顿动力公司创始人兼首席执行官马克·雷伯特(Marc Raibert)拍摄于 Simu Relativity
该展馆最大的亮点莫过于27家类人机器人厂商参展。
今年以来,这些承载着人类对智能极致想象的设备已获得资本市场近百亿元的投资。
人形主场,失败场面?
在WRC2024上,人形机器人受到了明星般的待遇。
如果你看到一群人拿着手机匆匆而过,却看不到人群中的核心人物,那么很有可能是某公司的人形机器人在行走——身高1.6米的机器人与人的身高非常不符,很容易淹没在人群中。
玉树人形机器人展示四个木制相对论镜头
站在展厅十字路口,星河通用、星动时代、诸暨动力、星尘智能等企业鳞次栉比,不远处,还有加速进化、宇树、致远机器人、星海图、钛虎、UniX AI、开普勒等推出人形机器人产品的企业。
四家公司站在人形机器人的十字路口,一年融资逾 10 亿美元 图片来源:Simu Relativity
这些人形机器人公司今年以来疯狂“席卷”资本圈。
仅这四家处于十字路口的公司,近一年来公开披露的融资总额就已超过10亿元,平均年龄仅有1岁半。
但即便赚得盆满钵满,在直观的现场演示中,不难发现各类人形机器人存在缺陷。
今年完成两轮融资的一家人形机器人公司,目前只能演示垂直领域的单点任务。
比如在分拣场景中,它只能抓取特定范围内的双面胶带,无法抓取剪刀、卷尺等。而且机器人的移动速度非常慢,一个仅需移动20厘米的抓取动作需要近40秒才能完成。
机器人抓取动作缓慢。图片由 Si Mu Relativity 拍摄
还有乐居,其演示的是一款烹饪机器人,却出乎意料地将食物当众倾倒在桌子上。
人形机器人送餐失败
此外,很多机器人还存在站立困难、分拣任务识别不清晰等问题。
在一项需要左右手对不同种类面包进行分类的任务中,当机器人放下右手去拿物品时,发现这是一个应该由左手分类的物品,因此只能进行大规模的空气拿铁艺术。
人形机器人在执行分类任务时“手忙脚乱”。图片来源:Si Mu Relativity
手脚不一致
双足人形机器人有用吗?这是展厅里被问到最多的问题。
现场的明星企业早已展现出各自对于脚的不同追求。
例如诸暨动力展示了其机器人被踢飞后快速稳定移动的绝技,兴东吉源则展示了其自主研发的机器人爬长城的视频。一墙之隔的银河环球,采用轮式底盘代替下肢,利用伸缩、吸盘、夹爪等完成取放货物、清洁办公桌等工作。
Galaxy Universal Robots,使用 Simu Relativity 3.5 倍加速度拍摄的视频
业界中,双足行走的支持者认为,机器人只有具备人类的形态(尤其是腿部),才能弯腰拾取物体,适应人类的工业、家庭和商业活动。
另一组公司认为,即便是双腿设计也无法实现360度全场景作业,轮式方案可以让类人机器人更快速地进入分段场景,并率先落地。
在产业链上下游,灵巧手也存在不同的技术路线。
手部关节的灵活度要达到什么程度?是五指形,还是抓捏形?
一种观点认为,人在操作时,真正负责施力、控制方向的只有拇指和食指,其他三根手指更多的是起到辅助作用。也有厂商认为,只有五指灵巧手才能满足力敏度要求高、材质差异大的场景需求。
专注于灵巧手和视觉解决方案的微鲸智能告诉Simu Relativity,现在不再需要三个指关节具有灵活性,因为大多数任务只需将食指和拇指捏在一起即可完成。
另一家灵巧手公司表示,其优势包括多个关节的灵活性。“我们的食指的关节都是可动的,里面的零件比其他公司做的要小,所以看起来并不臃肿。”
会场灵巧的双手演示四木相对论摄影
市场上灵巧手的价格在5万到10万元左右,客户多为实体企业。一些主打通用人形机器人的企业也开始进入灵巧手市场,比如星动吉源近期就推出了自己的灵巧手产品。
显然,在机器人领域,对双腿和功能齐全的手的需求并不普遍。
但各方都有一个共识,那就是尽快进入现场,获得真实的数据反馈。
尤其在工业场景方面,海外人形机器人代表特斯拉、Figure均选择对智能化要求较高的工厂场景作为第一站。
但无论哪种场景,当前的人形机器人都处于针对特定任务的训练阶段,与非人形机器人的差距并未拉大。
以汽车为例,汽车制造业分为冲压、焊装、涂装、总装四大工艺流程,在最复杂的装配工序中,自动化程度仅为20%-30%。
在总装过程中,工人要手工操作机器,有时还要进入车内拧螺丝、锤打等,与其他工人配合,进行检查。
这一场景需要上下肢、大脑与大脑之间的协同配合,理论上也是“完整”人形机器人的目标。
但目前世界上还没有任何一款人形机器人能够顺利弯腰捡起物体,更不用说完成这一系列操作了。
资本泡沫来临,行业仍举步维艰
面对人形机器人的自然流转,会场内有厂商坚决表示,绝不会涉足人形机器人。
“我们的产品没有人形的造型,没有腿也没有灵巧的手,但还是卖得很好。”一家创业近20年的服务机器人公司高管告诉《思牧相对论》,他觉得人形机器人现在只不过是一个To VC的故事,明年下半年这个泡沫就会破灭。
事实上,那些决定扣动扳机的投资者已经做出了选择。
一位投资人告诉《思木相对论》,虽然创业公司不少,但大家对国产人形机器人标的形成了一定的惯性,“基本大家都在投银河通用、致远机器人”。
这在一定程度上是因为人形机器人的高成本产生了资本集中效应——只有获得足够资金的公司才可以通过下一层。
致远机器人演示四木相对论摄影
理想情况下,一个成熟的人形机器人产品需要在算法、数据、传感器匹配、机械设计、电源、元器件、新材料等方面进行适配。
2024年,人形机器人崛起的第二年,虽然大模型、灵巧手等技术已经取得突破,但数据的稀缺、动力设计的难度、电机/传感器等硬件的不匹配、昂贵的价格都意味着人形机器人之路依然漫长。
每一个环节都需要长期的耐心和资金投入。
以数据问题为例,获取优质且足够廉价的数据是目前制约机器人发展的一大瓶颈,也是企业希望构建的壁垒。
发布会上,一款估值数百亿的人形机器人不断出现无法正常捏合、无法抓取物体等Bug,公司高层向《司牧相对论》解释称,这主要是训练数据不足导致的。
至于数据采集难度,海外巨头特斯拉、谷歌等均选择了“远程操控”路线,这种方式需要人带上采集设备,配合机器完成动作,优点是数据真实,缺点是采集耗时长、成本高。
例如,为了训练PaLM-E,谷歌动用了13台机器人,收集了17个月的数据,才得到足够的数据。如果是更复杂的工业场景,数据收集的成本会更高。
另外一个解决方案就是现在非常流行的模拟数据,这种解决方案的训练过程往往需要判断物体的材质,比如判断是否是杯子,然后设计抓取力度。
但由于缺乏对“摩擦力”等维度的建模,仿真数据仍然很难完全符合物理规律,这种不切实际的数据可能会导致机器人在实际作业中出现故障。
Galaxy General 的高层也告诉《Simu Relativity》,虽然模拟数据生成速度很快,但仍然需要了解机器人场景的专业人员介入,否则无法满足需求。
这里的专业性,不仅仅指对数据和机器人场景的理解,还包括实践经验的丰富性。
如果某公司的人形机器人具备抓握和移动能力,但是速度跟不上,那么可能意味着他们缺乏经验,采用了移动速度非常慢的训练数据,导致训练出来的机器人移动速度也很慢。
除了数据之外,电力硬件、材料等问题也依然明显。
例如,缺乏触觉会让机器人难以判断织物、水流等信息。而触觉传感器相较于其他传感器价格更昂贵,传感器反馈的数据也更为复杂。这些都是限制人形机器人落地的障碍。
星东吉源的灵巧之手,传感器均由其他供应商提供
除了人形机器人,各式机械臂、机器狗等也充斥着会场。此外,在家居领域,一些更垂直的智能工具已经展现出商业潜力。
比如下棋机器人元萝卜在展会上就吸引了大批喜欢围棋、象棋的学生,我们还看到家长们对下棋机器人很感兴趣,不断询问它的价格。
元罗展位挤满了孩子和家长。图片由 Simu Relativity 拍摄
余叔的机器狗也被一些普通用户购买,用于露营等场景。
宇树科技机器狗
世界上第一只机器狗诞生于1968年,距今已有56年,体型巨大,有时还需要人工操作,当时没人想到它能进入家庭。
也许信徒们会对今天的人形机器人抱有同样的耐心。