我们离通用具身智能似乎还有很长的距离

我们离通用具身智能似乎还有很长的距离。

对于要在开放的现实世界中 action，并需要对自己的 action 负责的机器来说，全无人似乎是一种妄念。

大多数在现实世界中执行任务的机器，首先需要是一台高效的机器，而不是拖后腿的机器。如果要想效率高，必然需要先专用化，也就是需要侧重为特定任务而设计，不管是软件还是硬件，不然这个机器的竞争力一定会很差，也很难在现实世界中推广开来。

也就是说在走向通用之前，需要先有一定的、有价值的专用能力。

我们假设这个专用能力可以超越人类，其实这很难，现在的自动驾驶端到端、各种机器人端到端任务，都在试图解决这个问题，但还处于攻坚阶段。

我们假设专用阶段已被攻克，这样一个「专用机器」，它需要多少的「理解现实的能力」才能 hold 住复杂多变的现实，保证事情不超出自己的控制，尤其是在复杂的环境中。

例如我在周末做饭时，不小心把锅边的纸巾烧了，旁边还连着油碗，成人当然知道该如何采取措施，如果是个做饭机器人呢？它会意识到问题，并妥善解决吗？

更多更复杂的场景还有很多，机器人可能需要 AGI 级别的智能才能在开放的复杂的场景中执行任务，不然就还需要人类在环、人类监督，或者回到限定的场景去做任务。

太长不看版：端到端任务，只能让机器人成为做该件事的专家，达到媲美人类做该件事的水平，但不是人类的智能水平；AGI 是机器人在开放域做任务的保障，不然只能是限定场景，或者有人监督。