/ 币百科

图AI正在增强人形机器人 - 在这里起作用的方式

发布时间:2025-02-21 05:02:21
欧意最新版本

欧意最新版本

欧意最新版本app是一款安全、稳定、可靠的数字货币交易平台。

APP下载  官网地址
本站报道:

图AI终于在星期四透露了“重大突破“这导致嗡嗡的机器人创业公司与其一位投资者OpenAI:一种新颖的双层系统AI体系结构打破了联系为每个编程。

与需要大量编程或为每个新任务进行演示的传统机器人不同,Helix将高级推理系统与实时电机控制结合在一起。它的两个系统有效地弥合了语义理解(知道什么是对象)与动作或运动控制(知道如何操纵这些对象)之间的差距。

这将使机器人随着时间的推移变得更有能力,而无需更新其系统或培训新数据。为了证明其工作原理,公司发布了视频显示了两个人物的机器人一起工作以放下杂货,一个机器人将物品交给另一个,将它们放在抽屉和冰箱中。

Digue声称,任何机器人都不知道他们正在处理的物品,但是他们能够识别哪些应该进入冰箱中,并且应该将哪些储存的物品储存干燥。

Adcock发推文说:“螺旋可以推广到任何家居物品。” “像人类一样,Helix可以理解语音,通过问题来理解,并且可以掌握任何对象,而无需培训或代码。”

魔术如何工作

为了实现这种概括能力,总部位于加利福尼亚州桑尼维尔的初创公司也开发了所谓的视觉语言动作(VLA)模型这统一了感知,语言理解和学习的控制,这就是其模型能够概括的原因。

图说,该模型标志着机器人技术的几个第一。它可以在200Hz处输出整个类人形上身的连续控制,包括单个手指运动,腕部位置,躯干方向和头部方向。它还可以使两个机器人与以前从​​未见过的对象合作。

螺旋中的突破来自其双重系统体系结构,它反映了人类认知:70亿个参数“系统2”视觉语言模型(VLM),该模型(VLM)在7-9Hz时处理高级理解(每秒更新其状态9次缓慢思考结构和复杂的任务或运动),以及8000万参数“系统1”视觉运动策略,将这些指令转化为200Hz的精确物理运动(基本上更新其状态每秒200次)进行快速思考。

图像:图AI

与以前的方法不同,Helix使用一组神经网络权重,用于所有行为,而无需特定于任务的微调。其中一个系统处理语音和视觉数据以实现复杂的决策,而另一个系统将这些说明转化为精确的运动动作,以实现实时响应。

“我们已经从事这个项目了一年多,旨在解决一般机器人技术,” Adcock推文。 “编码自己的方式行不通;我们只需要逐步改变能力即可扩展到十亿个单位机器人级别。”

Helix说,所有这些都打开了机器人技术新扩展定律的大门,该法律不依赖编码,而是依靠集体努力,该努力使模型在没有任何特定任务的任何事先培训的情况下都可以更有能力。

图像:图AI

在大约500小时的远程手工机器人行为上,经过了图形训练的螺旋,然后使用自动标记的过程为每次演示生成自然语言指令。整个系统都在机器人内的嵌入式GPU上运行,使其立即准备好用于商业用途。

AI说,它已经与宝马制造业和不愿透露姓名的美国主要客户达成了交易。该公司认为,这些伙伴关系创造了“在未来四年内通往100,000个机器人的道路”。

这家人类机器人公司今年早些时候从OpenAI,Microsoft,Nvidia和Jeff Bezos等投资者获得了26亿美元的估值,从而获得了6.75亿美元的B系列资金。据报道在谈话中再筹集15亿美元,将公司估计为395亿美元。

编辑安德鲁·海沃德(Andrew Hayward)

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com