8月6日,Figure.AI联合创始人 Brett Adcock 正式发布了目前最强的具身智能机器人 - Figure 02
大家还记得今年3月发布的 Figure 01演示视频么?它一经面世便惊艳了全球。Figure 01已经可以从桌上的物品中识别出苹果是食物并交给人类,还可以一边收拾桌子一边解释为什么这样选择,同时还可以对自己的行为进行评价。
* Figure 01演示视频,来源:https://www.figure.ai/
在如此强的前代基础上,Figure 02又有怎样更亮眼的表现呢?
* Figure 02演示视频,来源:https://www.figure.ai/
根据视频及官网介绍,本次更新后的 Figure 02 主要包括以下特点:
“说话的能力”(实时语音对话):配备了可连接定制OpenAI大模型的麦克风和扬声器;
“观察的能力”(摄像头):由6个RGB摄像头支持的AI视觉系统;
“推理的能力”(内置VLM):帮助机器人摄像头实现快速常识性视觉推理;
“行动的能力”(机械手):16个自由度的第四代机械手,力量与人类相当;
“续航的能力”(大容量电池):机器人配备2.25KWh的定制电池组,可提供超过50%的电量;
“计算的能力”(CPU/GPU):相比上一代,算力和AI推理能力提升了3倍;
Part
1
“说话的能力”
实时语音对话
作为官方合作方,OpenAI为Figure提供最先进的实时对话能力。借助OpenAI,Figure能够快速提升机器人语音功能。
Part
2
“观察的能力”
摄像头
为了能像人类一样理解世界,Figure 02通过多摄像头+AI驱动的视觉系统来进行感知与推理。其在头部、前躯干和后躯干共有 6个RGB摄像头,使得机器人具有超越人类的视觉能力。
Part
3
“推理的能力”
内置VLM
Figure 02的导航系统采用了 视觉语言模型(VLM),这使得装备在机器人上的摄像头能够开展语义基础研究和迅速进行常识性视觉推理。
VLM是当前众多造车新势力正在研究的智能驾驶新方向,在机器人领域,这种方法显然也可以在很多任务上实现突破性的效果。
Part
4
“行动的能力”
机械手
根据官方网站的介绍,Figure 02使用了 第四代人体骨骼手,每个手指和手腕都设计有多个关节,一共提供了16个自由度,允许手部执行复杂而精细的动作。这些自由度模仿了人类手部的自然运动范围,包括手指的弯曲、伸展、抓握以及手腕的旋转和倾斜。
这意味着Figure 02可以牢固地抓住物体,同时避免损坏脆弱物品,例如,在工业生产中,可以精准地抓取和操作各种工具和零部件,进一步扩大了商业应用场景。
Part
5
“续航的能力”
大容量电池
续航问题一直被认为是实现人形机器人实际应用的主要难题之一。Figure 02的躯干内配备了一块容量为 2.25KWh的定制电池,与Figure 01相比,能多提供超过 50% 的能量,从而显著延长机器人的运行时间。
Figure 02的电池也已经集成到人形机器人的躯干中,使其重心更接近中心线位置,使得机器人更加灵活。FigureAI还为其定制了电机,与关节传动系统集成在一起,以优化每个关节的功率和性能。通过演示视频我们可以看到,Figure 02的肩部、肘部、髋部和膝部四个主要关节组设计非常简洁,完美解决了这个难题。
Brett Adcock曾表示:“我们的目标是Figure每天能够有效工作20小时以上”。
事实上,Figure 02已经进厂,在宝马车间实现这个目标了。这种工作量确实是我们普通“打工人”再卷也无法超过的了。
Part
6
“计算的能力”
CPU/GPU
作为实体机器人最重要的硬件,CPU和GPU对实现多模态推理至关重要。与上一代产品相比,Figure 02采用了最新的AI芯片,其计算能力和推理能力提升了3倍,从而能够自主完成更多复杂且艰难的任务。
为最大化GPU和CPU的性能,Figure 02对其软件系统进行了全面优化。通过改进内存管理、任务调度和I/O处理等多个方面,确保数据能在CPU和GPU之间高效传输和处理,同时支持更多高性能的大模型运行。
Figure 02与Figure 01身高相似,看起来最明显的就是哑光黑色的外观,被网友戏称为参考了“新版蝙蝠侠战衣“,但感官上来说,第二代确实比前代的铬金属饰面更加低调高级。
相信随着未来各家大厂的更新迭代,将会有更多工厂会使用这种多模态、高性能机器人。
--- End ---
欢迎关注微软 智汇AI 官方账号
一手资讯抢先了解
喜欢就点击一下 在看 吧~