物种级具身智能的第二块拼图来自于东方,除了大语言模型的第一块拼图,类似Helix的端到端的训练框架的第三块拼图,中间缺失的一块拼图是带有东方智慧,道法自然的钱学森老前辈的思维科学,它可以被用来实现认知和情绪决策的大脑。
我们把具身智能的发展,划分为三个阶段。遥控表演级的、能独立完成真实环境任务的工种级的、能像人类一样让文明演进的物种级的。
现在我们处在1.5,现有具身智能,能在较为理想的环境中完成任务,但在变化环境中会失效,从1.5到2 我们就需要认知的大脑。一个自然的思路是,把类似DeepSeek的大模型(第一块拼图),作为具身智能的认知的大脑和第三块拼图Helix训练框架相结合,但是单纯直接使用大模型是不够的,现在世界上所有的AI,在被训练或设置完后,都会直觉性的进行反应,我们称之为底层的运算。
如果只有底层的运算,无论行为、思维、表达,在长期观察下都会和人有差距,没有“灵魂感”。思维工程效仿人类,赋予了AI眼、耳、鼻、舌、身、意的感知流结构,一旦有了感知流结构,AI能把自身的行为思维表达感知作为观照认知的课题,那么它就有了第二层的运算,比如思考我有没有成功地说服他,我为什么没有说服他,我应该怎么说服如此固执的人等等,这些都是第二层的运算。
第二层的运算,会反过来干预第一层的行为思维和表达,我们很容易认同,有了第二层的运算,AI就会让人感觉更有灵魂、更加聪明,来自第二层的干预,如果影响决定了行为,就和helix分装的行为能力对上了,这就是第二块拼图。
连接第三块拼图的地方,这个结构很自然、很简洁,我们也会相信,无论有怎样的既有运算,第二层的反思一定会让系统变得更聪明,但难点在哪呢?第二层的运算容易出复杂问题,这是大模型无法直接求解的,此时四维科学的道法自然将第二次发挥作用。