本文来自微信公众号:四木相对论,作者:四木相对论,原文标题:《机器人大会落幕,人形泡沫终于要到了?》,题图来自:AI生成
一年一度的机器人春晚——世界机器人大会(WRC2024)落幕了。
这次的世界机器人大会,一共有169 家机器人领域的企业参展。和智源大会、上海世界人工智能大会类似,这里同样“人山人海”。
在展馆内熙攘的人群中,各种规格的机械臂、灵巧手在半空中挥舞,轮足、四足、人形机器人展示着各类任务。
人形机器人物品分拣失误,视频经5倍加速
但在喧嚣的水面下,我们在展厅内依然发现一些疑惑和争议。
“人形”,是更大的非共识。
即便展馆内人形机器人随处可见,但全球机器人行业绝对大咖——波士顿动力公司的创始人Marc在大会中直言,自己非常不看好人形机器人行业。
他认为,工业机器人已经非常成熟,能够商业化,目前人形机器人“在某种程度上是一种炫耀,而不是一种生产力”。
Marc Raibert,波士顿动力创始人兼CEO四木相对论拍摄
而展馆内的更大亮点,也莫过于参展的27家人形机器人厂商。
这一年,承载着人类终极智能化想象的它们,已经从资本市场圈走近百亿元资金。
人形主场,扑街现场?
在WRC2024,人形机器人拥有明星般的待遇。
假如你看到一群人举着手机蜂拥而过,却看不清被簇拥的核心人士,大概率是某家公司的人形机器人正在走路——身高一米六的机器人很符合人类身高,也很容易被人群淹没。
宇树的人形机器人展示 四木相对论拍摄
站在展馆的一个十字路口,银河通用、星动纪元、逐迹动力和星尘智能分列四周。不远处,还有加速进化、宇树、智元机器人、星海图、钛虎、UniX AI、开普勒等拥有人形机器人产品的公司。
人形机器人十字路口的四家公司,一年融资超10亿四木相对论拍摄
这些人形机器人公司在这一年里疯狂“扫荡”资本圈。
仅盘踞在“十字路口”的这四家,近一年公开披露的融资金额已经超过10亿元。而它们的平均年龄,只有“一岁半”。
但即便吸金无数,在直观的现场演示中,不难发现各家人形机器人的Bug。
一家今年连续完成两轮融资的人形机器人公司,目前仅能展示垂直领域的单点任务。
比如在分拣这个场景中,它只能在特定范围内抓取双面胶,不能抓取剪刀、卷尺。而且,这个机器人移动的速度非常缓慢,完成一个只需要移动20厘米的抓取动作,需要近40秒。
机器人抓取操作动作迟缓 四木相对论拍摄
还有展示炒菜机器人的乐聚,在众目睽睽下直接上演了一出将菜倒在桌上的意外戏码。
人形机器人盛菜扑街
另外,还有不少机器人存在难以站稳,分拣任务识别不清等问题。
在一个左右手分拣不同类型面包的任务里,机器人放下右手准备拾起时,发现这是应由左手操作分拣的物品,只能上演一场大型空气拉花。
人形机器人执行分拣任务时“懵逼”四木相对论拍摄
手和脚的非共识
双足人形机器人到底有没有用?是展馆内出现次数更高的问题。
而现场的明星公司们,已经体现出对双足的不同追求。
比如,逐际动力在现场大秀机器人“挨踹”后迅速平稳的绝技,星动纪元展示出自家机器人爬长城的视频。一墙之隔的银河通用,则以轮式地盘代替下肢,以伸缩、吸盘、抓夹等部件完成取货、清理桌面等任务。
银河通用机器人,视频经3.5倍加速四木相对论拍摄
在行业中,双足的拥趸认为,机器人只有具备了人形(尤其是双腿),才能实现弯腰捡东西的操作,适应人类的工业、家庭、商业活动。
另一批公司则认为,哪怕是双腿的设计也无法实现360度全场景的操作。而轮式方案,更让人形机器人更快切入细分场景,率先落地。
在产业链的上下游,灵巧手也存在技术路线之分。
手的关节灵活性要做到什么程度?该是五指的形态,还是抓夹?
一种观点是,人手在操作时,真正发力和掌握方向的只有大指和食指,其余三指更多是辅助作用。也有厂商认为,只有五指形态的灵巧手,才能满足对力敏感度要求高、材料差异大的场景需求。
主攻灵巧手和视觉方案的“伟景智能”告诉“四木相对论”,现在没有必要做到三个指节的灵活,因为仅靠食指和大拇指的捏合,就能完成大部分任务。
另一家灵巧手公司表示,自己的优势就包括多个关节的灵活,“我们的食指关节都是能动的,里面的部件比别家做得小,不会显臃肿。”
会场中的灵巧手展示四木相对论拍摄
市面上灵巧手的售价在5万~10万左右,客户为具身公司。一些主攻通用人形机器人的公司,也开始进入灵巧手市场。比如,星动纪元近期就推出了自己的灵巧手产品。
显然,立刻拥有双足和五指健全双手的必要性,并未在机器人领域形成统一。
但尽快切入场景,获得真实数据的反哺,则是各家的共识。
尤其是工业场景,海外人形机器人代表,特斯拉和Figure都选择对智能化需求较高的工厂场景,作为落地之一站。
但不论是哪种场景,目前的人形机器人均处于训练特定任务的阶段,和非人形的差距并未拉开。
以汽车为例,汽车制造业分为四个工艺流程:冲压、焊接、涂装、总装。在最复杂的总装环节,自动化程度只有20%-30%。
在总装环节,工人要用手操作机器,有时还要钻到汽车里,要拧螺丝、敲敲打打,还要与其他工人配合,还要做检测。
这个需要上下肢、大小脑一起协作的场景,理论上是“完全体”的人形机器人的目标。
不过现在,全世界没有任何人形机器人能够流畅地弯腰捡东西,更别提完成这一系列操作。
资本泡沫将至,行业难度不减
面对人形的天然流量,场馆内有厂商坚定表示,自己决不会踏足人形机器人。
“我们的产品没有人形,没有腿和灵巧手,依然卖得很好。”一位创业近20年的服务机器人公司高管向“四木相对论”表示,他觉得人形机器人现在只是To VC的故事,而这个泡泡,明年下半年就会破。
事实上,决定扣下扳机的资方,已经纷纷作出选择。
有投资人告诉“四木相对论”,虽然初创公司不少,但大家对国内的人形机器人标的已经形成一定惯性,“基本上都把钱砸给银河通用和智元机器人”。
这一定程度上是因为人形机器人所需的高成本,使资本形成了聚集效应——只有获取到足够资金的公司,才能闯过接下来的关卡。
智元机器人展示四木相对论拍摄
理想状况下,一个成熟的人形机器人产品,需要在算法、数据、传感器搭配、力学设计、电力供给、零部件、新材料等层面完成适配。
而在2024年,人形机器人风起的第二年,虽然大模型、灵巧手等技术取得突破,但数据的稀缺、动力设计的困难、电机/传感器等硬件的不匹配和价格高昂,都意味着人形机器人之路依旧漫长。
这其中的每一个环节,都需要长期的耐心和资金投入。
拿数据难题举例。获得高质量且足够便宜的数据,是目前制约机器人发展的一大瓶颈,也是各公司希望构筑的壁垒。
在大会现场,一家估值数十亿元的人形机器人,不断出现捏合不到位、抓取不到物品等Bug。这家公司的高管向“四木相对论”解释,这主要还是因为训练数据不充足。
而对于数据难关,海外巨头特斯拉和谷歌都选择“遥操”路线。这种方式,需要人带上收集设备和机器配合完成动作,好处是数据真实,缺点是采集用时长,成本高。
比如,谷歌为了训练PaLM-E,用了13台机器人,收集了17个月,才拿到足够的数据量。如果是更复杂的工业场景,数据采集成本会更高。
另一种方案则是十分火热的仿真数据。这一方案的训练过程往往需要判断物体材质,比如判断是杯子,然后再设计抓取的力量。
但缺少对“摩擦”等维度的建模,让仿真数据彻底符合物理规律还存在难点。这种不够真实的数据,可能导致机器人在实操中任务失败。
银河通用的高管也向“四木相对论”表示,仿真的数据虽然生成速度快,但依旧需要了解机器人场景的专业人士介入,否则不太能满足需求。
这里的专业,不仅指对数据和机器人场景的理解,还包括实操经验的丰富度。
如果一家公司的人形机器人具备抓取、移动的能力,速度却跟不上,那可能意味着他们缺乏经验地采用了移动速度很慢的训练数据,导致训练出的机器人动作也很慢。
除却数据,动力硬件和材料等难题依旧明显。
比如,触觉的缺失会使机器人难以判断布料、水流等信息。但触觉传感器相比其他传感器来说成本较高,且传感器反馈的数据形态更加复杂。这些都是限制人形落地的阻力。
星动纪元的灵巧手,传感器由其他供应商提供
人形机器人之外,各种各样的机械臂、机器狗也充斥着会场。而且在家庭领域,一些更加垂类的智能工具已经体现出商业化潜力。
比如下棋机器人元萝卜,在展览现场吸引了大量喜欢围棋和象棋的学生。我们看到,家长也对下棋机器人充满兴趣,不断询问价格。
元萝卜展台挤满了儿童和家长,四木相对论拍摄
宇树的机器狗,也已经被一些普通用户买单,用在露营等场景。
宇树科技机器狗
世界上之一只机器狗诞生于1968年,距今已有56年历史。它身形巨大,有时需要人工进入机器内部操作。当时,没有人认为它能走进家庭。
对于今天的人形机器人,或许相信它的人会给予同样的耐心。
本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
正在改变与想要改变世界的人,都在虎嗅APP
发表评论