《现有的机器人都没大脑?》
人形机器人马拉松让公众看到了我们的机器人,目前还是遥控的,事实上,具身智能存在大量的误导宣传,很多我们看到的很颠覆的视频,都是拍了十多次,终于有一次成功,于是作为宣传。
我们把具身智能划分为三个等级,现在的具身智能处在1.5的状态。
第一个等级,遥控表演级的巨声智能,类似宇树之前展示的波士顿动力训练框架、能完成翻跟斗跳舞打太极等等,这些我们称之为行为能力。如果仅仅有行为能力,商业价值是很有限的,除了上台表演景区互动,没有太多意义。此时,具身智能机器人要靠人为遥控,来完成较为复杂的行为目标。
第二个等级,工种级别的具身智能,在行为节点上是行为目标,比如:收纳衣物、打扫卫生、去商场买东西,一个行为目标下,包含了一系列行为节点的组织,比如收拾屋子是一个行为目标,里面就包含了移动抓取、放置等多类行为的组织,一旦具身智能能完成整件工作,就能化身为工种,大规模商用就有可能了,包括了家内服务陪伴的机器人、工厂内的工人、街道上的环卫巡逻快递机器人等等。
第三个等级,物种级别的具身智能。物种和工种的区别是什么呢?从一个视角,人类的文明就是由无数人类个体的,一个个行为目标堆砌而成的,在这之上,有一个认知和情绪决策的大脑决定了要做什么,一切的行为目标都来自于更高的动机的分解。
前面我们说现在的具身智能处在1.5的状态,也就是在完成各种行为目标上,现在的具身智能还无法做到泛化,只有在理想环境下能完成任务。
为什么这么难呢?因为在真实环境有无限的可能,就以导航去一个地方为例子,下楼梯可能电梯坏了、可能被人误导下错楼层、打车时,司机开一半有事要求其下车等等。所以无法靠编程预设。
那么如何从1.5做到2呢?需要有一个认知的大脑。遇到困境时,停下来思考基于我的处境可行的行为空间,为达到当前的目标,我下一步做什么。如果具身智能具备这种人类的慢速思考能力,就能够在预设训练以及预设经验的反应模式无法覆盖时,通过思考组织行为寻找突破,把任务向前推进。
人形机器人马拉松让公众看到了我们的机器人,目前还是遥控的,事实上,具身智能存在大量的误导宣传,很多我们看到的很颠覆的视频,都是拍了十多次,终于有一次成功,于是作为宣传。
我们把具身智能划分为三个等级,现在的具身智能处在1.5的状态。
第一个等级,遥控表演级的巨声智能,类似宇树之前展示的波士顿动力训练框架、能完成翻跟斗跳舞打太极等等,这些我们称之为行为能力。如果仅仅有行为能力,商业价值是很有限的,除了上台表演景区互动,没有太多意义。此时,具身智能机器人要靠人为遥控,来完成较为复杂的行为目标。
第二个等级,工种级别的具身智能,在行为节点上是行为目标,比如:收纳衣物、打扫卫生、去商场买东西,一个行为目标下,包含了一系列行为节点的组织,比如收拾屋子是一个行为目标,里面就包含了移动抓取、放置等多类行为的组织,一旦具身智能能完成整件工作,就能化身为工种,大规模商用就有可能了,包括了家内服务陪伴的机器人、工厂内的工人、街道上的环卫巡逻快递机器人等等。
第三个等级,物种级别的具身智能。物种和工种的区别是什么呢?从一个视角,人类的文明就是由无数人类个体的,一个个行为目标堆砌而成的,在这之上,有一个认知和情绪决策的大脑决定了要做什么,一切的行为目标都来自于更高的动机的分解。
前面我们说现在的具身智能处在1.5的状态,也就是在完成各种行为目标上,现在的具身智能还无法做到泛化,只有在理想环境下能完成任务。
为什么这么难呢?因为在真实环境有无限的可能,就以导航去一个地方为例子,下楼梯可能电梯坏了、可能被人误导下错楼层、打车时,司机开一半有事要求其下车等等。所以无法靠编程预设。
那么如何从1.5做到2呢?需要有一个认知的大脑。遇到困境时,停下来思考基于我的处境可行的行为空间,为达到当前的目标,我下一步做什么。如果具身智能具备这种人类的慢速思考能力,就能够在预设训练以及预设经验的反应模式无法覆盖时,通过思考组织行为寻找突破,把任务向前推进。