容和解释:  我们的身体不仅仅是我们思维的容器,它同样也是思维本身的一部分,借助身体,我们得以与世界中的物体进行互动,从而去感知整个世界。 在自我参照下运行的感觉与运动功能系统,被称之为「身体图式」。人类通过身体图式来实现认知的具身性。 古希腊哲学家普罗泰戈拉曾说:「人是万物的尺度。」也就是说,我们的身体就是一把度量万事万物的尺子。 身体图式在正常社交中也有着重要的作用,这就是人机交互、用户体验的核心。正如前述唐纳德·A·诺曼在《The Desin of Everyday Thins》中所述的可供性(affordance)的用途。 以ChatGPT为代表的大语言模型,显然初步具有与人类类似的智能体,但是承载这些智能体的,是没有形体的一段段代码。 AI(例如ChatGPT大语言模型)在没有人类身体、且缺乏实践经验的情况下,是否能像人类一样感知到真实世界呢? 实际上,当我们去问只「读万卷书」语言模型,ChatGPT(GPT-4),它是否有身体时,它回答说:「It could be the size of an averae adult hun, around 5 feet 6 inches (167.6 c tall. This would allow to interact with the world and people in a faliar way.」  这段文字翻译过来是:「我的身体应该与一个平均成年人的身高相当,大约为5英尺6英寸(167.6厘米)。这将使我能够以一种熟悉的方式与世界和人们进行交互。」 虽然ChatGPT没有真实的身体、无法与世界进行互动,但它却在字面逻辑上表现出与人类相似的对世界的感知能力——对物体的可供性有着基于人类身体大小的划分。 但是认知科学观点认为,身体图式是建立在我们所具有的对自己的身体长期的知觉体验之上的,只能来源于外部的「真实交互」,即「行万里路」。 也就是说,ChatGPT不具有真正的身体图式,面对陌生的环境,ChatGPT是无法通过可供性(affordance)去探索和形成对新环境的主动认知。 这是ChatGPT之类AI智能体与人类能力的本质上的区别。 那么未来的可能发展方向就不言而明了,给ChatGPT大语言模型「装上身体」,这意味着将机器人与ChatGPT相结合,从而推动AI支持的机器人在导航、物体操作和其他与生存和目标实现相关的任务中发展能力、取得突破。“自主意识”的涌现也将成为可能。 当然我们也可以直接联想到另外一个令人兴奋的领域,将具备思考和理解能力的ChatGPT与自动驾驶相结合。当前的自动驾驶虽然具备感知能力,但缺乏思考和理解的能力,可以称为是「有眼无脑」。 通过ChatGPT与自动驾驶技术的融合,我们可能有望将自动驾驶技术从目前的L2/L3级别提升到L4甚至L5级别。 而另一方面,汽车和各种车载传感器能够赋予ChatGPT“一具身体”,使它能够真正与全世界进行基于道路环境的多模态交互。当ChatGPT不再只是「读万卷书」,而是「行万里路」时,它将会展现出全新的智能和潜力。 这可能是人工智能下一次突破的方向,想象一下,汽车人也许就在下一波汽车AI浪潮中产生。  汽车人AI 3.我是谁 关于人类意识有一件很重要的事情就是,人会注意到,在与世界的互动中有一件事总是存在,即人体自己。那么,对于AI是否如此?  在早期的面向对现程序语言设计中(例如slltalk),出现了Self关键字,这是底层程序代码层面的自我概念抽象表达。 Jüren Schdhuber(LSTM与现代人工智能之父)曾经提到过,人工智能在1991年就已经获得了「自我意识」:在循环世界模型中(recurrent world-del),通过一些神经元对AI本身进行编码表达是非常有效率的,不管你什么时候激活这些与自我符号相关的神经元,AI都在思考着自身。 当然,Schdhuber所说的AI自我意识,并不是指人工智能系统具备了人类类似的意识和感知能力,而是指AI系统具备了一定程度的自我感知和自我理解能力,能够对自己的状态、行为和环境进行分析和优化。 但是,这从根本上解决了我是谁的问题,对于AI来说,定义了自我,为未来AI装配类人身体去感受真实世界,提供了互动的基础。也为“自主意识”的产生打下了基础 4.意识的前提  人类意识的产生机制是复杂的,意识存在的物理基础是大脑和神经系统,存储在人类生物学大脑的1000多亿神经元与100万亿神经突触构成生物存储器中。每一个神经元和每一个神经突触构成的生物电路都会形成独特的记忆。 意识是人的神经反应,意识的出现,必须要有功能健全的大脑与眼、耳、鼻、舌、身等去感知当前环境中相对应的色、声、味、触觉等产生出意识,从而形成对真实世界的一个多维度认知描述与建模。 在熟睡或昏厥或死亡的时候,意识亦无法生成,也就是中断的,因此无觉无知,什么都不知道。由此可见意识也会中断。 所以我们可以看到,人类思维和自主意识的形成,是通过身体、大脑神经系统和自然环境长期相互作用而逐步进化产生的。 同样的,身体的环境感知能力,带来对事物抽象建模能力,基于对环境事物抽象建模记忆,才可能涌现出原始的语言以及图形符号、文字记录能力 ANI与更高一级的 AGI(自主通用智能)不同之处在于学习的途径,ANI的学习是间接学习,是其通过人类输入的大量数据进行预训练形成的,ANI的校准反馈来自人类,由于缺乏数据的”对与错“校准