李德毅院士：认知的形式化

点击：作者：李德毅 1 郑思仪 2 黄立威 3 刘玉超来源：战略前沿技术微信号发布时间:2024-06-25 12:09:52

编者按人类认知的整个活动，就是如何解释、解决人类在生存和繁衍过程中所遇到的现实问题。OODA环是指挥控制领域的经典认知模式。2021年李德毅院士就在第九届中国指挥控制大会作主旨报告“对OODA环的再认识——用脑和认知科学解开博伊德环之谜”。近期，李院士明确提出人类认知的 4 种基本模式：记忆驱动的经验模式（OOA）、知识驱动的推理模式（OODA）、联想驱动的创造模式（OOCA）以及假说驱动的发现模式（OOHA），用这 4个相对独立的认知模式来完成认知的形式化。这也为未来指挥控制的研究带来了新的启发思路。

摘要：人类认知的整个活动，就是如何解释、解决人类在生存和繁衍过程中所遇到的现实问题。通过分析古今中外著名的认知案例，概括人类认知的4种基本模式为记忆驱动的经验模式(OOA)、知识驱动的推理模式(OODA)、联想驱动的创造模式(OOCA)以及假说驱动的发现模式(OOHA)，用这4个相对独立的认知模式来完成认知的形式化，OOA和OOCA两个模式是由下而上思维，从物理空间转向认知空间；OODA和OOHA两个模式是由上而下思维，从认知空间转向物理空间。4个模式发生的频度不同，相互之间的转换带有不确定性，共同构成了趋于统一的无尽认知。认知的形式化为构建可交互、会学习和自成长的新一代人工智能系统架构奠定了基础。

1　认知的螺旋式过程

著名的法国启蒙思想家、哲学家和教育家卢梭说，“人生而自由，却无往不在枷锁之中”。思想生而自由，却又无处不在形式化之中，这很好地诠释了“以约束为前提”的思维。所以，认知离不开形式化。认知是学习以及解释、解决现实问题的能力，而学习的能力常常是解释、解决预设问题的能力，预设问题就是现实问题的形式化。人类和其他生物相比，以抽象、联想和交互见长，但人类能否把宇宙的奥秘探寻清楚仍然是个谜。在宇宙这个巨大的物理空间中，绝大多数的物质硬构体是自在的，并不是以人为本的。人的本性是求知，杰出科学家和工程师都有一个基本的信念，即相信宇宙在本质上是有秩序的和可认知的，这是一切科学工作的基础。物理学家阿尔伯特·爱因斯坦说，“宇宙最不可理解之处是它是可理解的”。但一个人在宇宙里的地位太过渺小，在有限短暂的生命中要认知无限是一件十分困难的事情。人类能够通过文明、文化的传承，形成科学的理论，解释如此广袤的宇宙，站在牛顿、爱因斯坦、达尔文等科学巨人的肩膀上，继续探索，就能够把越来越多的未知变成已知。“可理解”本质上是人类认知的群体共识，尽管人类认知的道路曲折，对于千万年前还不可理解的事物，因为“知识断层”或者“学科断层”等诸多因素，现在人类可能也仅理解了其中的一部分，但却是在逼近真理。人类认知的整个活动，就是如何解释、解决人类在生存和繁衍过程中所遇到的现实问题。每一次完整的认知活动可以分为感知、思维和行为个阶段。感知是认知的源泉，思维是认知空间里的内在思考，行为是认知的目的和外化表现。无论是认知自然的能力，还是认知人文的精神，都不是与生俱来的物质存在，它自成体系，比物理空间更为深远广阔。认知活动不停地在物理空间和认知空间循环交互，以回答“在哪里”“是什么”“为什么”“怎么做”等问题。近 300万年，人类大脑容积激增、大脑皮层组织与功能爆发式进化，使得人类认知有了生物学基础。尤其是近10000年以来，人类发明了语言、文字、工具、教育、科技，产生了文化和文明，群体认知所积累的人工智能对环境生态的改变虽然微弱，但使人类看到了未来的希望。每个人都有一个由生物学意义进化而来的、基于大脑皮层复杂神经网络形成的认知空间，在其成长与生活环境里，通过具身行为与物理空间及其他人进行交互。其在成长过程中，接受教育，学习科学和技术，吸收群体的智能，并通过自己的思维和实践，不停地修饰、修剪或重塑大脑皮层神经网络细胞及连接，形成了个体独特的认知。

1.1 时间是认知的基石

宇宙一直处在运动和变化中，在人类创造出时间概念之前，生物在地球上出现之前或者灭绝之后，这些运动和变化都一直延续。宇宙里没有绝对时间，同一个时钟放置在宇宙的不同位置呈现不同的时间，时间不能完全脱离和独立于空间。但对人类来说，进化使大脑有了分工的记忆区，包括瞬时记忆区、工作记忆区和长期记忆区，正是记忆让人类延续了过去和现在的认知，从而区分过去和现在。历史就是过去的现在，现在又将成为过去。以史为镜，这是人类高等生物群体特有的认知方法。时间不是物质，可以用年月日时分秒表达时刻，用高精度的时钟度量时间间隔，时间不是发现，而是发明。时间是物质变化和运动顺序的表现，用来形容物体或者天体的运动，用来描述人类自身进化的历史和文明，用来度量从有序走向无序的熵增过程。反过来，正是这些描述或度量让人类感受到了时间的存在。认知机器包括物质、能量、结构和时间4个基本要素，其中时间对于机器的认知至关重要，机器在没有能量供给的时候是一堆死物质。时钟依赖能量，时间依赖时钟，秩序依赖时间，机器自举实现思维自动化，自我复用实现认知自成长，机器运行靠程序，程序靠时序，软件靠交互，时序和交互产生负熵，机器赖负熵为生。时钟不停，与外界交互不息，思维和认知不止。机器之所以能思维，是因为至少存在下一个时间周期，使得机器能继续去“想”，人的思维和机器的思维在数学上是同构的。只有人类依靠想象力和创造力发明了时间，人类才能够认知时间、标记时间并度量时间，用时间来记忆、记录和解释宇宙天体的运动变化、物质的化学变化、物体的空间变化、生物的机体变化，以及人类社会自身文明的发展等。时间成为认知空间不可或缺的要素，是认知的基石。

1.2　数学是认知最抽象的语言

宇宙有运动，运动有秩序。宇宙里没有数学，数学却可以解释宇宙。对宇宙本身而言，数学没有意义，对人类来说，数学是现实世界的主观反映。思维的核心是抽象、联想和交互，抽象是结构形成的基础。科学的各个学科都有自己的专业语言，但自然语言是所有专业语言的元语言。思维的最高形式是数学，数学是人类自然语言的高阶形态，是建立在明确的公设定理体系之上的。通过数学反映万物，通过函数和泛函反映万物之间的关联，形成人类认知自然的一个飞跃。抽象的数学语言从无到有的形成过程很漫长。文字产生之初就开始发明数字符号，数和直线等基础概念的形成经过了漫长的时间，数学作为一种基于公理知识的形式系统，不断地被人们用来解释现实世界的实体。人们只是想利用数学来解释、证明自然界的现象而已，数学思维对于认识宇宙发挥了极其重要的作用。数学产生结构和数据，抽象的数据在智能时代被比作“石油”，可以进行大数据挖掘，帮助寻求事物运行的规律。数学是基于想象和推理的，数学不是发现，而是发明。例如：无理数的发明是体现数学理论在解释自然规律和现象深刻性方面的一个典型例子，无理数是无限不循环小数，是不能通过测量得到的；点是没有大小的，线是没有宽度的，面是没有厚度的；数学能够研究、解释无限的世界，并可以利用无限研究有限，整数有无限个，实数也有无限个，这两个无限是有本质差别的。伟大的数学家戴维·希尔伯特说，“从未有其他的问题能如此深刻地触动人的心灵，没有其他的思想能如此富有成果地激发人的思维逻辑领悟力”。在个人的认知世界里，思维常常远超出实际。如虚数是通过解方程x²+1=0 产生的，后来才发现有广泛的应用；17世纪才被用于描述田奇的运动；黎曼几何是广义相对论的数学框架；纤维丛理论在规范场理论中发挥的作用；矩阵和无限维空间在描述量子力学中的重要意义；概率论在统计力学、生物和金融中的广泛应用等。一切数学结果必须根据事先明确规定的公理用演绎法推出，伟大的数学家高斯曾说“数学是科学的皇后”，那么宇宙应该是数学的“皇帝”。把数学归属于自然科学并不确切，物理是研究现实存在的，是基于观察和实证的，没有数学，宇宙里的很多现象和规律就无法表达。物质和能量都是有量纲的，数学是不带有任何物理量纲的主观认知，关注的仅仅是量与形的规律。物理被写在宇宙这本“天书”里，它持续地打开在人类眼前，但在人类的认知空间里，在人类学会书写文字和符号之前，在发明数学之前，人类是无法读懂这本“天书”的。因此，数学是探索和认知物理空间的工具。人类在数学上的尝试使得人们开始理解宇宙。爱因斯坦说，“纯粹的数学构造使我们能够发现概念和联系这些概念的规律，这些概念和规律给了我们理解自然现象的钥匙”。因此，数学受到高于其他一切学科的特殊尊重。但是，无论数学语言如何抽象，结构如何复杂，它也离不开人类自然语言的支撑。

1.3　认知的螺旋

人类既是自然的成员，也是自然的观察者。一个人在物理空间中的具身行为和在认知空间中的思维活动，总是以“感知、思维、行为、再感知、再思维、再行为”的方式交互、循环、迭代，人脑进化形成瞬时记忆、工作记忆和长期记忆个不同的、分层级的区域。感知是认知的源泉，利用各种感觉器官联合观察，在瞬时记忆区依据当前注意力，通过跨模态感知融合得到的信息，进一步在工作记忆区利用记忆智能和计算智能作出判断和决策，巩固或调整长期记忆区，通过具身行为与客观世界交互。行为是认知的目的和外化表现。感知和行为都发生在物理空间中，思维发生在认知空间中，感知、思维和行为随时间变化在物理空间和认知空间中不停循环。一个正确的认知往往需要经过由物理空间到认知空间、再到物理空间的多次迭代。每一次迭代得到的结果会作为下一次迭代的初始，不断地纠错、调整和提升不同形式的记忆区。认知的形式化需要分析以下几点：认知的开放性，尤其是交互性；认知的不确定性，尤其是不确定性中的基本确定性；认知的层次性，尤其是递归性；认知的主动性，尤其是注意力机制；认知的复杂性，尤其是涌现；认知的整体性，尤其是感知—思维—行为之间的协同性。物理空间和认知空间的交互，激发了人类的想象力和创造力，激发了从感知到思维的再抽象。每一次感知到的可能仅仅是部分特征、不完整碎片和属性，如时空识别或者目标识别。而思维是对被认知事物整体进行领悟、顿悟的过程，是对已有的记忆概念进行联想、再理解、再调整，或者是对认知事件进行统一，形成整体记忆。因此，思维是感知的高阶，行为是思维的目的和外化，认知随时间变化不断螺旋提升。人类是群居动物，人类智能始于语言，人工智能始于文字，语言和文字是人类思维共通共有的载体。人在主观的、抽象的和内在的认知空间里通过语言、文字进行学习、思维、分享，试图以此解释外在的、客观的和实在的物理空间的奥秘，解决现实中的各种问题，形成群体共识，最终形成人类文明生态。只有通过思维实现认知和记忆的不断累积，人类或机器在认知空间里的知识和智能才能成长，越来越逼近真实，才能不断解释、解决物理空间的诸多现实问题以及从未出现过的新问题。无论是个人、群体，还是人类或者智能机器，弄清认知的基本模式/范式非常重要，这是所有认知科学的工具和基础。

2　认知形式化的 4 种基本模式

《实践论》中提到，“无论何人要认识什么事物，除了同那个事物接触，即生活于（实践于）那个事物的环境中，是没有法子解决的”。这就是感知、思维和行为的关系。其中还提及，“感觉到了的东西，我们不能立刻理解它，只有理解了的东西，才更深刻地感觉它”。这就是思维，是感知的高阶。去粗取精，去伪存真，由此及彼，由表及里，分层分类，形而上，形成认知物理空间的知识体系，更新记忆，实现认知映射，有人称之为知识图谱或认知地图。不论是认知、思维，还是智能，都是指学习的能力，以及解释、解决问题的能力。人工智能是人类智能的体外延伸。本文从曾经的人工智能符号主义学派拓展“抽象”，从连接主义学派拓展“联想”，从行为主义学派拓展“交互”，研究认知的形式化，从而提出认知形式化存在以下4种基本的认知模式（认知范式），为构建可交互、会学习、自成长的新一代人工智能架构奠定基础。

2.1　记忆驱动的经验模式

人类认知始于行为也终于行为，行为最原始的方法是不停地从形象上模仿和试错，在物理空间通过视听等感知手段主动观察（observe）待解决问题的表象，在认知空间进行思维活动，分析和判断(orient）当前情况，对多通道、跨模态的感知数据去除噪声，消解冲突，进行情境融合，聚焦问题态势，然后唤醒记忆，在大脑皮层搜索，执简驭繁，从早先的记忆中迅速匹配到应对方案，在物理空间中进行行动（act）验证，一次次反复实践，形成记忆或者巩固记忆。记忆是思维的结果，是在重复行为中加深的结果，具有统计意义。如果再遇到同样的问题，直接选择记忆中对的方案，按经验处理即可，通过经验生成的记忆具有对新对象的识别能力。先界定边界，后推理。把一部分经验解释清楚的认知先放到特定边界的记忆中去完成推理，如果不行，再根据外部任务环境的变化结合自己的认知去确定问题的新前提或者新边界。在一个新的记忆边界框架下再推理，如此循环，直到问题被正确解决。在这种记忆驱动的经验模式 OOA（observe-orient-act）中，记忆智能发挥了十分重要的作用。小孩从牙牙学语就开始养成小样本记忆，如识别妈妈和周围人群。小样本记忆的核心是记忆边界形成的小世界。机器学习中的深度学习从人脸识别开始取得成功，依靠记忆驱动实现分类和归纳，记忆随着脑发育而迅速成长，形成越来越多的经验数据。这都表明记忆智能和生长的环境强相关。

2.1.1　案例一：二十四节气

人类依据二十四节气开展农耕活动和养生活动，是记忆驱动的经验模式中的典型案例。我国古代劳动人民长期反复观察太阳周年运动，进行判断，搜索匹配记忆里有关二十四节气的季节规律，直接开展实践活动。早在春秋时代，便有“二分”（春分、秋分）和“二至”（夏至、冬至）个节气，到了战国末期，又增加了“四立”（立春、立夏、立秋、立冬），又经过 100 多年的逐步补充，到秦汉时期基本完备。用天气的寒暑（小暑、大暑、处暑、小寒、大寒）、水气的凝结（白露、寒露、霜降）、雨雪的多少（雨水、谷雨、小雪、大雪）和生物的发育（惊蛰、清明、小满、芒种）来反映某一天属于春夏秋冬的程度，形成二十四节气对应农耕活动和养生活动的群体记忆。人们观察当前的时间，判断离哪个节气最近，搜索匹配已有的经验，直接进行行动。如对于芹菜种植而言，立夏育苗，立秋定植，立冬收获。记忆驱动的二十四节气经验行为还有很多，如图1所示。

图1 二十四节气的农耕活动和养生活动

2.1.2　案例二：传统中医

传统中医的观察方法是“望、闻、问、切”。望诊患者的神色、舌象；闻诊患者的咳嗽、呼吸、口气、体气；问诊身体的寒热、是否出汗、大小便的形态、饮食喜恶和劳倦；切诊包括脉诊（触摸脉象的变化），如脉的沉浮、虚实、迟数、滑涩、洪细等，还有按诊，如胸腹的软硬、皮肤的肿胀、手足的温凉等。通过全面的分析，判断疾病的病机，搜索匹配医家丰富的经验，特别是自己长期实践形成的案例记忆，高效快捷地开出合适的方剂或者针灸治疗方案，强调一人一策，一次一方，待一个疗程之后，再观察患者，再诊断、治疗。中医诊断是根据肌体整体状态不断调整治疗方案的 OOA 交互过程（图 2）。

图2 中医诊断的 OOA 交互过程

2.1.3 案例三：深度学习识别人脸和语音

近 10 年，深度学习极大地推动了人工智能的革新深度学习算法依靠大数据驱动实现了机器视觉、语音识别等感知的智能。机器通过学习大规模数据样本来训练一个深度神经网络大模型架构中的结构参数和上亿级数量的连接权重。对于卷积神经网络、Transformer 等各类深度学习模型（图 3），如果算力足够大，由大量人工神经元和相互连接权重构成的深度神经网络具有逼近任意复杂函数的泛化能力。机器基于大量的示例可以自主学习完成感知识别，无须进行显式编程，通过尝试、犯错以及自我调整等操作，逐步减少感知误差，机器通过自主学习实现感知智能，开辟了机器学习的新纪元。这与高等生物视觉神经系统分层的观察、联想和识别十分类似，成功模拟了从人的视网膜到初级视觉皮层，再到视觉皮层，最后到颞下皮层的视觉神经系统的感知。深度学习利用大量标记或无标记数据来学习，属于记忆驱动的经验模式。标记数据代表了人类的经验，作为机器先验的领域知识，实现了注意力选择和语义提取，替代长期记忆，形成解决实际问题中的记忆智能和记忆驱动。当前，基于自监督预训练的大规模深度学习模型已经成为新一代人工智能应用的基础设施，其可以对海量无标记数据进行记忆。整个模型代表了人类共同的经验，所有人员在使用阶段能够直接调用基础模型，不需要进行复杂逻辑推理，而是直接给出解决问题的方案。深度学习正是属于记忆驱动的经验认知模式。

图3 各类深度学习模型

2.1.4案例四：人工驾驶日常生活中，人工驾驶是记忆驱动经验模式中的一个明显案例。驾驶是一个“观察—判断—行动” 的过程，熟练的司机拥有许多关于驾驶的记忆智能，大部分情况下是依据已有的经验直接驾驶车辆，很少进行精确推理或者计算。其并不拘泥于精确的数字，而仅是安全驾驶，其驾驶行为很自如，驾驶动作近乎本能。人在一生成长过程中的许多智能和技能，都属于记忆驱动的经验模式。在人类的多元认知中，这种模式是最原始、最直觉、最基础的，也是最宝贵的，历久弥新。

2.2　知识驱动的推理模式

人类的第一次认知革命是 6 000 年前语言、文字和教育的发明，从而创造了文化和文明。摩尔根将文明定义为“这一时代以声音字母之使用以及文字记录之制作而开始”[18]。智能可以脱离人体以文字等形式独立存在，人工智能始于文字，随后发明了教育，教育浓缩重演了人类的文明，迅速实现了人类认知的二次扩张，使得人类知识和技能得以传承 [19-20]。人类通过接受教育掌握群体积累的知识，从此人类认知有了知识驱动的推理模式，表现为“观察（observe）—判断（orient）—决策（decide）—行动（act）”的认知螺旋形式，简称为 OODA。首先是观察。观察发生在物理空间。这需要融入周围环境，对物理空间特定领域问题所处的变化进行细致观察，形成感知。感知有时是被动的，观察是主动的，需要了解问题的背景和要素。其次是判断。判断是认知循环中最重要的一环，发生在认知空间，对要解决的问题进行导向和定位，聚焦当前的态势，利用自己的知识以及前期观察到的相关现象，判断当前状态和发展趋势，对现象分析进行解释，最终形成判断。但并不是一定能够形成判断，如果判断有困难，要返回外部环境再观察。再次是决策。决策发生在工作记忆区，提取长期记忆中已经具有的关于这个特定情境下的相关知识、符号处理模型和算法，进行逻辑推理或演绎计算，比较不同方案的优劣和风险，作出决策，形成特定问题的具体解决方案。同样，如果观察和判断不到位，就很难作出决策，此时就需要迅速返回到前两步，甚至陷入局部死循环。最后是行动。行动需要返回到物理空间中，按照决策的方案步骤执行，决策的正确性只有在实践中才能得到验证。整个过程不断迭代，形成一个螺旋式认知过程，如图4所示。将认知看作以逻辑为基础的符号推理过程或计算活动，正是人们期望的可解释的人工智能。

图4 物理空间和认知空间中的 OODA 循环

2.2.1　案例五：自驾驶

自驾驶的目标是实现一个有感知、有认知、有行为、可交互、会学习、自成长的轮式机器人。区别于人工驾驶，自驾驶的关键是要厘清驾驶认知中的 OODA 循环。车辆通过各类异构传感器在物理空间完成对周边环境和自身状态的瞬时感知。在认知空间的工作记忆区，利用选择性注意机制，识别当前场景，从感知的各类跨模态信息中，提取出与驾驶活动相关的要素，形成驾驶态势和实际拥有路权的变化，从长期记忆中提取相关知识，对态势进行分析和理解，作出每次的操控决策。自驾驶车辆通过电信号直接控制方向盘、油门、刹车和档位等车辆执行机构，使车辆达到或接近期望的动力学行为。最后将当前状态反馈给感知系统，形成闭环。在跟随驾驶、路口驾驶、换道超车和泊车等典型驾驶场景中，可利用OODA模式来实现车辆的自驾驶（图5）。

图5 自驾驶认知中的OODA循环

2.2.2　案例六：检验医学

西医以溯因和解释为主。西医对病人常常分科进行门诊、检验和治疗。根据临床症状观察和医学仪器进行诊查，包括体液学、血液学、微生物学、生理生化等常规检验和花样（图6）。如通过磁共振、计算机断层扫描（CT）、超声、心电图和运动平板试验等获得大量生理数据，医生再根据自身所掌握的医学知识和经验作出判断。例如，对于慢性心血管疾病，医生根据检验结果作出了“前降支重度狭窄的冠状动脉粥样硬化”的判断，再结合病人的具体情况和比较成熟的冠心病治疗方案，经过理性分析，比较不同方案的优劣，最终作出决策，给出精准治疗的措施，如药物治疗、冠状动脉介入治疗或者冠状动脉搭桥治疗等，以实现血运重建。

图6 西医以溯因和解释为主，分科门诊、检验和治疗

知识是人类的共同财富，语言、文字和教育是人类智能的基石 [22]。人类群体的知识和技能通过传承学习和自主学习，成为个体智能。OODA 认知模式使得人类思想的逻辑性、通用性和可解释性增强，理性思维占据主导。1956 年达特茅斯会议之后，“思维的本质即计算”形成热潮 [23]，用计算机来实现知识驱动的推理取得巨大成功，知识工程、专家系统得以普遍应用，导致以计算智能为代表的人工智能得到巨大发展，促进了人类智能和人工智能的迅速迭代成长。

2.3　联想驱动的创造模式

思维的核心是抽象和联想。抽象是联想的基础，联想产生类比，进而形成一般智能，也称通用智能。联想驱动的创造模式最早可追溯到10 000年前的农业革命。到了500年前的工业革命，即物质革命和技术革命，以蒸汽机的发明为标志，人类通过抽象和联想，逐渐掌握了如何利用物质和能量创造动力工具来延伸人的体能。自此，联想驱动的创造模式开始非常迅速地发展，形成人类的第二次认知革命。重大技术工程，甚至技术革命的目标都是由人类创造新的物件来极大地解放人的体力，即利用宇宙里的天然物质发明人工物件，并把人类智能物化到人类发明的工具、仪器、机器等各种组织结构，乃至自然中，解决现实中的众多实际问题，进一步解放人的智力。创造人工物件，需要回答“怎么做”的问题，主要依靠实践。联想驱动的创造模式通过对物理空间的事件进行观察，从而产生联想，利用已有的知识，在自己的认知空间里进行判断，总结出需要解决的问题，然后利用自然界的材料、物质和能源，以及想象力、创造力，创造出全新的人工物件，再回到物理空间通过行动进行验证，证明创造的有效性。这就构成了以联想驱动的创造模式，即“观察（observe）—判断（orient）—创造（create）—行动（act）”的 OOCA 循环。2.3.1　案例七：轮子的发明轮子是人类创造的古老人工物件的代表，人们经常把它的发明和火的使用相提并论。轮子的发明距今已有约5 500 年的历史。古人通过观察，发现石头、圆木等物体的滚动可以解决滑动阻力过大的问题，由此联想，发明了轮子。进一步，将轮子和轮轴进行结合，并让两者分离，从而发明了自由转动的轮子（图7）。轮子是联想驱动的创造模式的一个典型案例。

图7 轮子的演变2.3.2

案例八：数学的机械化数学的机械化最早可追溯到结绳记数，之后发明了手工算盘。最早的算盘是由我国东汉数学家徐岳发明的，他所撰的《数术记遗》中写到，“珠算控带四时，经纬三才”。意思是把木板刻为三个部分，上下两个部分是停游珠用的，中间部分用作定位。每位各有五颗珠，上面一颗珠与下面四颗珠用颜色区别，后称之为“档”。上面一珠当五，下面每珠当一。算盘由古代的“筹算”演变而来，唐代已见筹算乘除法的改进，到宋代产生了筹算的除法歌诀。15 世纪中期的《鲁班木经》中有制造算盘的流程，1593 年明代程大位所著的《算法统宗》是流传最久的珠算书。几千年来算盘一直是我国古代人普遍使用的计算工具，即使现代的电子计算器也不能完全取代算盘。在《九章算术》中有对开平方、开立方的机械化过程描述，到宋元时代又有求解高次代数方程的机械化方法。从算盘、比例规、对数计算尺等计算工具发展到第一台手摇机械计算机，即1642 年法国科学家帕斯卡发明的一种能代替人工进行快速计算的机器（图8）。我国著名数学家吴文俊对数学的机械化也作出了重要的贡献，提出了使用计算机证明几何定理的“吴方法”[24]，为数学机械化的发展奠定了坚实的基础。

图8 算盘、比例规、对数计算尺和手摇机械计算机

2.3.3 案例九：立轴大风车立轴大风车是我国公元12 世纪前后发明的一种人工物件，是一种旋转轴垂直于地面的风力机械。立轴大风车是根据船帆的设计和运行产生的联想，用来解决如何有效利用风力驱动水车的问题，其巧妙之处在于风帆能够自动调节迎风方向，接受任意方向的来风，为龙骨水车提供原动力，实现自动工作。立轴大风车可用于农田灌溉等，其设计、制造与使用体现了因地制宜的思想。可以说，其是以联想驱动创造的一种风力的、自动化的动力装置（图9）。

图9 立轴大风车示意

2.3.4 案例十：都江堰水利工程更早的重大人工发明可追溯到公元前256 年前后的都江堰水利工程，其位于四川省都江堰市西的岷江干流上，是世界上现存历史最久远的无坝引水工程，经历代不断改造与完善，沿用至今。渠首枢纽包括鱼嘴、飞沙堰和宝瓶口 3项主要工程，分别起到分水、泄洪排沙和引水作用，因为选择在特定位置，在分水时具有调节外江水流比例的作用，在旱涝时期能够形成相反的四六比例，满足了灌溉与防洪的需要。尽管主持修建的李冰父子那时未必懂得流体动力学理论，但这项工程成为千古不朽的水利工程（图 10）。

图10 都江堰水利工程示意

2.3.5 案例十一：测量时间的工具宇宙里只有运动和变化，没有时间，更没有绝对时间，时间是人类自己发明的概念。自然进化形成的具有抽象、联想和记忆能力的脑神经系统，是人类发明时间的生物学基础。测量时间的工具包括日冕和钟摆等。钟摆理论是由意大利著名数学家与物理学家伽利略提出的，具体的科学实验则由荷兰数学家与物理学家惠更斯完成。1657 年荷兰钟表制造师科斯特制造出了第一台摆钟，1658 年惠更斯出版了《摆钟论》（图11）。如果把同一批生产的相同时钟放置在宇宙的不同位置，会呈现出不同的时间，这就充分证明了时间不能完全脱离和独立于空间。人类农耕时代只能发明简单的手工工具来测量时间，如沙漏，这类工具包括物质和结构双要素。到工业革命时期，人类发明复杂的机器来测量时间，如钟表。复杂机器是由各种机械零部件按照一定结构组装成的、能够利用能量运转产生有用功的装置。目前人们使用的原子钟芯片，每2 000 万年才会产生 1 s 的误差。在智能时代，只有将时钟加入智能机器中，才使机器有了思维的能力。

图11 惠更斯发明钟摆

2.3.6 案例十二：人文作品在人类的精神世界中，语言、文字和情感常常是共通的，承载着人们丰富的内心思想或精神追求。人文工作者观察社会生活中的个人或者人群，从政治、国家、政党、族群、团体或社区中汲取思想营养，判断并创作出有关哲学的、思想的、精神的、文学的各类作品，包括宗教、哲学、宪章、法律、信仰、诗歌、小说、音乐和美术等。好的人文作品一定能滋养和丰富人们的精神生活和想象力。这样的人工物件既源于生活又高于生活，还会反作用于生活。一旦被社会认同接受，就可以成为群体认知或群体智慧，促进人类文明。2.3.7　案例十三：人造卫星定位系统用多颗人造卫星来定位，是根据天体定位联想而来的(图12)。中国北斗卫星导航系统(BDS)美国全球定位系统(GPS)、俄罗斯格洛纳斯卫星导航系统(GNSS)和欧盟研制的伽利略卫星导航系统(GSNS)属于人造工程。这些定位的技术从最初的定位精度低、不能实时定位、难以提供及时的导航服务，发展到如今的高精度全球定位系统，辅以地基增强系统，实现了任意时刻、任意地点都可以同时观测到4颗以上的卫星，也实现了导航、定位和授时等功能。卫星导航定位可以用来引导飞机、船舶车辆和个人沿着选定的路线准确到达目的地，也可以应用到手机追踪等诸多其他功能中。

图12 北斗卫星导航定位系统人造工程

2.3.8 案例十四：智能芯片当前，人类认知创造的代表性人工物件是支撑程序运行的微电子技术和人工智能芯片。以家用电器为例，空调、电冰箱、吸尘器、扫地机、电饭煲和热水器等都被嵌入了一个小的人工物件——带有时钟的智能芯片（图 13）。从解决生活中的实际问题出发，通过 OOCA 循环迭代和版本升级，人工智能芯片的可行性和可靠性得到大幅提高。工业革命时期由物质和能量组成的机器，在智能时代变成了可交互、会学习、自成长的智能机器，成为“有温度”的家用电器。

图13 智能芯片

联想驱动的创造模式主要是工程师和技术员等通过技术或工程实践实现的发明创造，在物理空间中形成物质硬构体，如人造城市、人造建筑、人造卫星等，虽然对整个宇宙的改变是微乎其微的，但对人类认知乃至人类社会的影响是深远的。在以联想驱动的“观察—判断—创造—验证”的创造模式中，人工创造的物件不仅仅是物理空间里的技术和工程等物质硬构体，还可以是人类思想寄生在物质上形成的人文作品。值得注意的是，这类人类精神世界中的虚幻物件，反过来可能让人产生过度幻想。

2.4 假说驱动的发现模式

近 100多年，人类进入第三次认知革命--交叉科学革命，主要研究如何填补物质科学、生命科学和社会科学之间的鸿沟，同时重视大科学交叉中的基础研究。对物理空间的自然、生命以及发生的社会事件进行反复观察(observe)，然后在认知空间中运用想象力，对事件进行深入判断(orient)创造性地提出假说(hypothesis)，再到物理空间用行动( act)验证,如此反复,就构成了“观察-判断假说-行动”的 OOHA 模式。这是人类认知的自由创造，不具有任何其他客观性。如果观察不够充分，就不足以形成判断，或者判断的结果不足以形成假说，或者行动的结果不足以验证假说，则又需要回到前一个环节进行局部小循环。

OOHA 模式是一个厚积薄发的过程，它十分尊重观察和实验，发挥科学家的认知力和创造力。该模式起源于感觉，但并不是所有人都能够拥有这样的认知模式，只有极少数超凡的知识精英，有特殊的天赋和罕见的专注，善于向群体学习，才能做到，如物理学家、数学家、力学家牛顿。他们对全人类认知的贡献比“普通”的高水平学者，要“伟大” 百倍甚至更多。

人们开始时普遍认为地球是平的，到了古希腊时期，亚里士多德认为地球是圆形的、静止的，地球是宇宙的中心。之后，哥白尼认为地球和行星在围绕着太阳的圆周轨道上运动，被 100 年后的开普勒和伽利略所证明。1687 年牛顿才正确解释了行星围绕太阳公转的原因。牛顿的代表作《自然哲学的数学原理》发表，遵循了古希腊的公理化方法，从定义、公理出发，导出命题，利用极限理论和微积分（流数术），提出牛顿三大定律。这部划时代的经典力学著作，影响了物理学、天文学、数学和工程学等几乎所有近代科学领域，也影响了哲学、神学，乃至启蒙运动等社会变革。这早已成为人类共享的知识，并通过教育代代传承。

经过几千年人类文明的积累，假说驱动的发现模式构成了许许多多的学科，科学乃分科而学，是所有学科的总称。这些分学科的、体系化的自然知识，可以解释自然现象和现实生活中遇到的问题，主要回答为什么。人类发明了教育，确保了学科知识的普及和传承。在每个人的头脑里，都有独特的认知映射图，反映其对科学知识体系的认知以及对各类学科的认知。

假说在科学问题研究中发挥纲领性的作用，任何学科的理论都是人类在自己认知空间中建立的一套解释系统，讲清楚物理空间实体事件的原因，是基于特定假说前提下的存活。天文学中的“日心说”、地质学中的“板块构造学说”、物理学中的“原子结构学说”、化学中的“燃素说”、地球科学中的“盖亚假说”、生物学中的“遗传变异学说”等在科学史上都发挥了重要作用。科学发展的历史就是新的假说和原来假说之间竞争、更迭的历史。实验检验假说前提下的理论，若在物理空间中观察到和假说相一致的结果，则该理论成立，并增加了人们对该假说的信赖。科学通过证伪而发展，一旦发现和假说不一致的新观察，就必须修正或者抛弃该假说。

2.4.1　案例十五：达尔文的《物种起源》

1859 年达尔文的《物种起源》[25] 开创了生物学发展史上的新纪元（图 14），否定了当时的神学。达尔文通过对古生物学、生物地理学、形态学、胚胎学和分类学等领域的大量研究，以自然选择为中心，从变异性、遗传性、人工选择、生存竞争和适应等方面论证物种起源和生命自然界的多样性与统一性。由简单到复杂，由低等到高等，不断发展变化，用自然选择、物竞天择、适者生存，给出物种发展的新解释，自此生命科学迅速崛起。但达尔文没有专门研究脑科学和人类认知，没有解释人类区别于其他高等生物的原因。

图14 达尔文的《物种起源》

2.4.2案例十六:门捷列夫的元素周期表1869 年化学家门捷列夫提出元素(以及由它所形成的单质和化合物)的性质随着原子量(现根据国家标准称为相对原子质量)的递增而呈周期性的变化，将当时已经发现的63种元素，依据原子量递变(并适当留下空位)，排列为周期纵成族的完美体系。他根据周围元素的性质预言了亚硼、亚铝和亚硅3个未知元素。这在以后的十几年内，逐一得到证实，使人们相信元素周期表阐明了自然界重要的本质(图15)。

图15 门捷列夫与元素周期表

2.4.3案例十七:爱因斯坦的相对论

1905年爱因斯坦提出要抛弃绝对时间，提出相对论，1915 年又提出广义相对论(图16)。宇宙学的最终目标是希望能够提供一个描述整个宇宙的统一理论，目前虽尚未实现，但可以用广义相对论描述引力和宇宙的大尺度(1024km)结构，用量子力学解释尺度极端微小的（10-12 km）现象。人们通过精确观测水星，发现它的运动和牛顿引力理论预言的运动有微小的差异，而爱因斯坦广义相对论却可以正确预言其运动。这个事实是对这个新理论的一个关键的证实。如弗里德曼和勒梅特基于爱因斯坦的引力场方程提出了宇宙膨胀的假说，最终被哈勃观测验证，而史瓦西利用引力场方程提出了黑洞的假说，最终也被观测证实。

图16 爱因斯坦提出相对论

2.4.4案例十八：数学中的猜想

数学一定要建立在公理之上，如两点可以划一条直线、所有直角都全等都是无须证明的，欧几里得把这些作为基本的公理。数学学科的发展实际上就是诸多数学猜想不断被提出、修正和证明的过程（图17）。如 3 个数的平方如果有勾股定理的关系，那么也可以有高次幂的关系，这就是数论中著名的费马方程。直到20 世纪 90 年代，这个困扰了数学家300 多年的问题才被安德鲁·怀尔斯解决。又如，素数是数学研究中最基本的对象之一，针对素数在自然数中占有多少的问题，最有智慧的数学家也无法解决。哥德巴赫提出猜想：每一个大于的偶数都是两个素数的和。截至目前，人类并未完全理解它们，最好的结果是陈景润证明了每个充分大的偶数都可以写成一个素数加另一个数，另一个数的素数因子个数不超过。黎曼猜想也是数学中最有名的问题之一，它与素数研究有着非常密切的关系。实际上，当时黎曼提出这个猜想就是为了研究素数，而且黎曼假设现在还没有完全解决。大自然赋予人类的渴望多于智慧，是无尽的认知追求。

图17 数学中的猜想

2.4.5案例十九:DNA 双螺旋结构

1953年2月，沃森、克里克看到了富兰克林在1951年 11月拍摄的一张 DNA 品体X射线衍射照片受到了启发。他们提出并确认了 DNA 的螺旋结构分析得出了螺旋参数(图18)四。双螺旋结构显示出 DNA 分子在细胞分裂时能够自我复制，完善地解释了生命体要繁衍后代，以及物种如何保持稳定的原因，即细胞内必须存在有遗传属性和复制能力的机制。这是假说驱动的发现模式推动大科学交叉基础研究发展的一个典型案例。当前，正在兴起的智能科学也是一个跨物质科学、生命科学和社会科学的新交叉学科。

图18 DNA 双螺旋结构

人类认知中崇尚想象力和创造力的完全自由，开辟了不以应用为目的的基础研究，以兴趣寻求合作，不宜组织大团队“攻关”。尽管可解释性是相对的，但科学更广泛的可解释性是人类永远的追求。在学科发展过程中，设计出的新理论往往是原先理论的一次扩展。随着人类认知的推进，牛顿力学、量子力学、相对论或者达尔文的生命科学等可能会被证明不是完全正确的。科学的伟大在于能够解释科学的界限在哪儿。哲学上认为客观世界完全独立于主观世界而存在，这也并非是完全正确的。人们真正观察到的是客观和主观之间的结合，由于客观的世界不是静止的，观察者和被观察的世界又存在相互作用，任何时刻都不可能把主观世界和客观世界分离得一清二楚，也不可能精准地把客观世界了解透彻。

3　各智其智，智人之智，智智与共，兼容并蓄

3.1　认知模式之间转换的不确定性

人们讨论生物自然进化的现象时，常用的时间尺度是“万年”；讨论人类文明生态现象时，常用的时间尺度是“千年”；讨论科学技术的进步时，常用的时间尺度是“百年”，甚至“十年”。随着6 000 年前人类文明诞生后，尤其是技术革命造就的现代文明诞生后，联想驱动的创造模式迅速崛起，智能的材料、能源、工具、机器和工程等不断出现，成为科学的先导，如应用核能形成的人工物件核弹可以毁灭地球，但同时催熟了核科学。假说驱动的发现模式是近 200 年才大量出现的。美国科学家Simon[27] 在《人造物的科学》中多次强调：科学发现只是一种特殊类型的问题求解。假说驱动的发现模式一旦成为人类共享的知识，成为知识驱动的推理模式的源头，其作用不低于人造的核弹。有的时候，几十年整个人类群体认知进展不大;有的时候，几位杰出人物的重大发现，对全人类的认知会影响几百年。得益于语言、文字和教育，以及人工智能和人类智能的不断迭代发展，体外延伸的人工智能为人类智能提供了一面巨大的镜子，映射出人类认知无尽的演化历程。

人类的认知过程是通过不断的实践推动的，而不是由时间尽头的“绝对真理”目标拉动的，就如同生物进化是从过去的物种进化来的，而不是向目标物种去进化。认知从根本上是不断学习、持续成长的，而成长需要时间来积累。

认知的形式化就是要厘清认知活动，为实现认知机器化奠定基础。本文提出用4个相对独立的认知模式来完成认知的形式化，OOA侧重于形象思维如果用机器实现这种模式，要求机器具有的硬核是算法、算力和数据;OODA侧重于逻辑思维，如果用机器实现这种模式，要求机器具有的硬核是算法和算力;0OCA和OOHA更多依赖于人的灵感和顿悟，如果用机器实现这种模式，要求机器具有新的硬核--抽象、联想和交五。00A 和 OOCA 两个模式是由下而上实现的，形而上，从物理空间转向认知空间:OODA和OOHA两个模式是由上而下实现的，形而下，从认知空间转向物理空间。4个模式发生的频度不同，相互之间的转换常常带有不确定性。认知模式转换不确定性的物理学依据可追溯到最小自由能原理。

OOA、OODA、OOCA 和OOHA4种认知模式相互之间是排他的，在同一时间不存在混合模式。可以将其统一刻画为 OOXA，差别是X。对特定的一个人，也许一生没有任何创造或者发现。对于一个要解决的特定问题，如驾驶认知，在人或者智能机器的不同成长阶段，几个模式之间可以转换运用。认知螺旋中的试错、犯错、纠错的实践，不可或缺负面的记忆甚至更难遗忘，时间之箭留下认知模式在物理空间和认知空间迭代的痕迹。4种认知模式在物理空间与认知空间中的迭代如图19所示。

图19 4 种认知模式在物理空间与认知空间中的迭代

多元认知模式形成的多元智能覆盖形象思维逻辑思维和顿悟，核心是抽象、联想和交互，其相互支撑、转换、驱动，互为先导，螺旋推进。就个人的认知而言，想象力和创造力是有差异的，在不同时期、不同情境，可能会采用不同的认知模式小孩从牙牙学语就开始形成记忆驱动的经验模式幼脑外皮层的重塑能力非常强，学会了语言、文字，记忆智能快速增长；进入学校，直到读完大学，个人会接受各种教育，掌握人类的群体智能和知识，学会理性分析问题，运用知识驱动的推理模式的场景显著增加；进入社会，参加工作之后，更多的是自主学习、实践活动和感悟，会不经意地激活记忆网络，呈现一种崭新结构，从一种认知模式转换到另外一种认知模式，如尝试采用联想驱动的创造模式，在失败中成长；随着时间推移，又会转到知识驱动的推理模式。对于少数天才而言，也许能够通过假说获得重大发现。

对同一个问题，不同人的认知模式可能不同，如初学者驾驶可能采用OODA 模式;熟悉路况的司机可能采用OOA模式;对专门从事自动驾驶研究的工程师们，可能采用 0OCA 模式，创造出一个全新的人工物件--机器驾驶脑，代替驾驶员的认知对同一个问题，同一个人在不同时间的认知模式也可能不同。当仅采用一种模式无法解决难题时，通常会寻找另一种模式来解决。即使当时无解，也不会停止求知。在人类历史长河中，使用较多的是记忆驱动的经验模式。当人们对事物有了一定的认知，就能够运用知识对事物作出判断和推理，即运用知识驱动的推理模式解决实际问题。无论是创造还是发现，都需要联想驱动的创造模式和假说驱动的发现模式它们都是非常艰难的，对于多数人而言，终其一生可能也无法做到，但这也是社会不断前进的真正动力。

3.2　认知从多元趋向统一，是无尽的追求

对于人类认知的模式，本文提出的种模式可能难以完全覆盖。最好有一个统一的模式，可称作元模式，覆盖并解释所有包含的子模式，但是这比较困难。如同人类的几千种语言，不能用统一的世界语言——元语言来覆盖一样。因为语言是由语境、语用、语义和语法4个要素决定的，不可能找到一种元语言去覆盖所有语言。哥德尔不完全性定理虽然证明了形式系统的不完备性，给人类形式化的系统划定了一点边界，让人明白止其所止，不可穷尽，亦即有所穷尽，但人类永远可以在“实在主义”中通过直观和直觉引入构成高一级形式系统的新东西，建立新公理系统，原有形式系统中不可定义、不可证明的部分，在新系统中即可多涵盖一点，如此推进以至无穷。就像不能阻挡人们对语言统一形式化——元语言的追求一样，认知从多元趋向统一是人类无尽的追求。在多元驱动下的认知模式之间的不确定性转换，会促进知识图谱的微重构，通过大脑皮层神经元网络的反复修饰、修剪和重塑，随时间形成新的认知和记忆。人脑的生命期非常有限，是智能的弱统一体，各智其智，智人之智，智智与共，兼容并蓄，是人之常态。

4　结语

人类的学习能力和记忆能力、人类创造虚拟物件和人造物件的能力源于生物的进化，源于用语言传递和交流思想的群居生活，源于生存和竞争，源于长期记忆只记抽象的“小宇宙”，源于本能的适应性。这使得人类后天的认知在人类文明的生态里可以有飞跃发展。传承学习、集体学习和自主学习迭代的结果，使得人类认知这块“长板”更长。和地球上其他物种相比，人类率先从“觅食者”跃升为“种植者”“生产者”“建设者”，又进一步跃升为“创造者”。劳动创造人类，认知成就人类。人类的认知力、想象力、学习的能力，以及解释、解决问题的能力，正在快速提升。

人类对认知的追求要比对知识和智能的占有更可贵。人类认知呈螺旋式发展，不会有尽头，人类认知之球愈大，则其与未知接触之界面会更大。生命进化赋予了人类大脑皮层特有的思维优势、学习优势、认知优势、创造优势，极大地释放了人的体力和智力。和地球上其他物种相比，人类没有无条件地服从大自然的进化，而是努力创造出各种各样的工具和机器等，解放人的体力和智力，使人类站到了地球生物链的顶端。

来源：中国人工智能学会

作者：李德毅 1 郑思仪 2 黄立威 3 刘玉超

责任编辑：向太阳

特别申明：

1、本文只代表作者个人观点，不代表本站观点，仅供大家学习参考；

2、本站属于非营利性网站，如涉及版权和名誉问题，请及时与本站联系，我们将及时做相应处理；

3、欢迎各位网友光临阅览，文明上网，依法守规，IP可查。

作者相关信息

李德毅院士：认知的形式化

2024-06-25

内容相关信息

李德毅院士：认知的形式化