我们离通用具身智能似乎还有很长的距离。

对于要在开放的现实世界中 action,并需要对自己的 action 负责的机器来说,全无人似乎是一种妄念。

大多数在现实世界中执行任务的机器,首先需要是一台高效的机器,而不是拖后腿的机器。如果要想效率高,必然需要先专用化,也就是需要侧重为特定任务而设计,不管是软件还是硬件,不然这个机器的竞争力一定会很差,也很难在现实世界中推广开来。

也就是说在走向通用之前,需要先有一定的、有价值的专用能力。

我们假设这个专用能力可以超越人类,其实这很难,现在的自动驾驶端到端、各种机器人端到端任务,都在试图解决这个问题,但还处于攻坚阶段。

我们假设专用阶段已被攻克,这样一个「专用机器」,它需要多少的「理解现实的能力」才能 hold 住复杂多变的现实,保证事情不超出自己的控制,尤其是在复杂的环境中。

例如我在周末做饭时,不小心把锅边的纸巾烧了,旁边还连着油碗,成人当然知道该如何采取措施,如果是个做饭机器人呢?它会意识到问题,并妥善解决吗?

更多更复杂的场景还有很多,机器人可能需要 AGI 级别的智能才能在开放的复杂的场景中执行任务,不然就还需要人类在环、人类监督,或者回到限定的场景去做任务。

太长不看版:端到端任务,只能让机器人成为做该件事的专家,达到媲美人类做该件事的水平,但不是人类的智能水平;AGI 是机器人在开放域做任务的保障,不然只能是限定场景,或者有人监督。
 
 
Back to Top