一段关于“Figure 01”的令人毛骨悚然的演示视频在互联网上流传开来——我简直不敢相信这不是电影《我,机器人》中被删除的一幕。
在演示中,装载了OpenAI技术的Figure 01被问及它能“看见”什么。展示出它的视觉识别能力,这个前卫的机器人准确地解释了它面前的物体:一个红苹果、一个带有餐具的晾碗架,以及提问的那个人。
好吧,这有点神秘,但这并不是我们之前没见过的,对吧?例如,去年,谷歌展示了AI模型Gemini如何能够识别放在它面前的刺激物,从一个蓝色的橡胶鸭到各种手绘插图。
但随后,那个人问:“我可以吃点东西吗?”Figure 01抓起苹果,清楚地认出它是桌上唯一可以食用的物体,并把它递给了他。
呃,我们确定威尔·史密斯不会很快出现吗?
Figure 01机器人是如何工作的呢?
究竟是什么使得Figure 01能与人类无缝互动?一个新的视觉语言模型将Figure 01从一个笨重的废铁变成了一个有点过于类似人类的科幻感十足的未来派机器人。
在递给那个人苹果之后,当被问到“你能在捡起这个垃圾的同时解释你为什么给我苹果吗?”Figure 01揭示了它能够同时处理多项任务。
在识别出什么是垃圾并将正确的物品放入它认为是垃圾桶的同时,机器人解释说,它给那个人苹果是因为那是他面前唯一可以吃的东西。这是一些令人印象深刻的多任务处理能力!
最后,那个人问Figure 01它认为自己做得怎么样。以一种对话的方式,机器人说:“我-我认为我做得相当不错。苹果找到了新主人,垃圾被清理掉了,餐具也放回了它该去的地方。”
根据Figure的创始人Brett Adcock所说,Figure 01配备了摄像头,这些摄像头向VLM提供数据,帮助它“理解”面前的场景,使机器人能够与面前的人顺畅地互动。Adcock以及Figure 01的创造是几位来自波士顿动力公司、特斯拉、谷歌深度思维和Archer航空的关键人物的智慧结晶。
Adcock在谈到伊隆·马斯克的Optimus机器人时表示,Figure 01并非遥控操作。换句话说,与Optimus不同,后者因折叠衬衫而走红,Figure 01可以独立操作。
Adcock的最终目标是什么?培训一个超级先进的AI系统来控制数十亿台人形机器人,可能会彻底改变多个行业。看来《我,机器人》比我们想象的要更加真实了。
参考
[1]
用户评论