《具身智能自主性的基础移动导航功能》
移动导航功能,是具身智能自主性形成的基础。因为和人一样,具身智能的诸多行为选择,比如去找某人去办某事、去买去拿某东西,都需要以移动到特定位置,作为前置条件。我们要求具身智能,不仅仅需要具备有图导航的能力,还需要对于陌生空间,在探索利用视觉发现位置线索,或是通过人类的指路讲解生成虚拟路径完成无图导航的能力。

在移动中,具身智能体能对自己走出一个地图空间有意识,能搜索记忆中存储的新空间的地图,如果之前没有到过这个地方能意识到是一个新的空间,并启动无图导航的宏观执行,和移动导航相互配合。具身智能体需要像人类一样能通过视觉形成对空间的认知和存储。

在工程效果上,能借助看图说话或其他视觉功能,在看到关注的目标时,把目标标定在地图上的特定位置。移动任务的底层是由强化学习的行走姿态调整能力、导航能力、视觉建图能力组成,但如果仅仅有这些,具身智能体只能够在理想的环境下完成移动任务。如果过程中遇到困境,比如电梯坏了按不到电梯键,下错楼层距离太远需要打车,或者被司机中途放下来了,找不到电梯厅等等,此时中速反应的反应模式中枢会在经验记忆中,寻找突破困境的经验办法,主导行为执行序列的形成。如果反应模式的经验无法覆盖当前的情况,就会转为慢速思维,会依赖认知的复杂问题求解思考突破困境的办法。
 
 
Back to Top