梅宏院士：如何构造人工群体智能？

——智源大会特邀报告回顾

点击：2791 作者：梅宏来源：人工智能学家微信号发布时间:2022-06-07 10:24:48

导读：在自然界当中，群体智能广泛存在，诸如蜂群、蚁群以及鱼群的聚集。而从宏观上说，人类社会的不断发展和演化也是一种群体智能现象，绝大多数文明成果都是人类个体在长期群体化、社会化的生产生活中逐渐演化形成的产物。

群体智能研究正是新一代人工智能的重要方向。

在2022北京智源大会首日的特邀报告环节，中国科学院院士梅宏发表了题为「如何构造人工群体智能」的主旨演讲。梅宏院士介绍了群体智能研究的历史与最新进展，并讨论了如何构造基于「探索-融合-反馈」机制的群体智能模型，举例说明了群体智能规律在自组装、拼图、知识图谱构建等任务中的应用。（注：本文由第三方整理，未经本人审阅）

群体智能研究前世今生✦

群体智能是科学家长期关注并研究的自然现象。早期的研究工作观测到，很多低等社会性生物群体中有一种看似矛盾的现象：不具备智能或者能力非常有限的个体所构成的群体展现出远远超出个体能力的智能行为。这种在低等社会性生物群体层面上展现出的智能通常被称为「群体智能」（Swarm Intelligence）。

「群体智能」广泛存在于自然界中，例如：

（1）黏菌聚合：当环境中食物匮乏时，黏菌会聚合形成变形虫，进行更大范围的移动；

（2）封群筑巢：蜂群通过大规模群体协同构筑蜂巢；

（3）鱼群避敌：鱼群通过大规模的群体协同躲避敌人；

（4）蚁群寻食：蚁群通过大规模群体协同在环境中发现和运输食物。

数十年来，科学家们尝试对「群体智能」现象做出解释。1959 年，法国动物学家 Pierre-Paul Grasse 提出环境激发效应（Stigmergy），用于解释低等生物群体中的智能现象。Stigmergy 一词由两个希腊词根构成：stigma（刺激）和 ergon（工作），即受到刺激而进行工作。

基于环境激发效应，群体智能的现象形成过程如下：个体在环境中留下的踪迹会被群体中的其他个体感知到，并刺激这些个体在环境中留下新的踪迹，从而不断产生正反馈。环境激发效应描述了个体之间通过环境形成间接交互的机制。

人类社会中也存在大量「群体智能」现象，例如：在没有规划和指挥的情况下，草坪上会涌现出弯弯曲曲的小路；任何一个草坪上的小路放任不管，没有规划也没有人的指挥，会形成几条弯弯曲曲的小路。法国心理学家勒庞在群体心理学经典著作《乌合之众》中指出，受到有效激励和鼓励后，群体汇聚的能力会产生惊人破坏力。中国俗语「三个臭裨将，顶个诸葛亮」生动形象地说明了智力平平的个体团结在一起也可能做出高质量的决策。市场经济中「看不见的手」也可以对大规模市场资源进行有效配置。

从宏观上说，人类社会的不断发展和演化也是一种群体智能现象，绝大多数文明成果都是人类个体在长期群体化、社会化的生产生活中逐渐演化形成的产物。

群体智能研究✦

近年来，《完美的群体》、《群体的智慧》等科普性图书的出现提升了大众对于群体智能的关注度。2010 年，在《科学》杂志上发表的论文「Evidence for a Collective Intelligence Factor in the Performance of Human Groups」用定量的方式观察到物理空间中的小群体在协同求解问题时存在群体智能现象。该论文将针对个体智能的度量统计方法应用于群体智能的度量，提出了名为「c factor」的度量指标。在物理空间中 2-4 人的群体任务求解过程中，作者观察到：群体智能与个体的平均智能或最高智能弱相关；与个体平均社会敏感度、个体对话平等度以及群体中女性的比例强相关。此例也在一定程度上印证了「三个臭裨将，顶个诸葛亮」的说法。

2005 年，《科学》杂志曾提出过 125 个有待研究的科学问题。其中，排名第 16 的问题为「人类合作行为如何演化形成」。科学家们观察到，合作行为在低等生物之间以及人类社会中广泛存在。达尔文曾指出「互惠」是一种有效的个体适应策略，从而试图解释这种合作行为。

然而，目前仍然缺乏充分的证据来解释自然选择如何导致互惠与合作行为形成。去年，《科学》杂志与上海交通大学再次联合发布了 125 个科学问题，明确提出「群体智能如何涌现形成」的科学问题，进一步将问题扩展到了「人-机混合群体」中。为了研究群体智能的涌现机理，需要使用科学方法对群体智能进行观察和度量，还要开发可以有效促进群体智能形成的可组装基本模块。

当前的群体智能研究主要针对物理空间中低等生物的群体智能现象展开，普遍采用「观察现象-发现规律-解释现象」的科学研究方法。通常而言，传统的群体智能研究动作较少关注现象规律的应用，仍停留在解释规律和现象的层面，需要更好地将这些规律用于构造求解特定问题的人类群体智能系统中。实际上，早年间计算机领域的科研人员已经在演化算法中将生物群体中的规律应用于优化问题求解，其中群体由一组具有预定行为规则的简单虚拟个体构成。这是人们在这一方向上的初步探索案例之一。

在传统的群体智能研究场景下，阻碍人们利用规律构造人类群体智能系统的主要原因在于：

（1）对群体智能形成机理缺乏充分理解，尚无权威共识。无法确保求解特定问题时群体智能可以重复可控地发生。

（2）物理空间受限，阻碍了人类群体智能的形成。在物理空间中汇聚大规模人群的成本太高。管理效率有时会随着人数增多而降低，人类群体很难在局部物理空间内长时间同步高效工作。

网络空间中的群体智能✦

互联网的诞生拓展了空间，为群体智能研究带来了新的可能性。网络空间中的群体不再受地域和时间限制，可以构建更大规模松散人类群体，个体之间通过同步、异步、显式、隐式的方式更加灵活地交互。互联网技术的不断发展促进了网络空间中人类群体智能系统探索的成功实践。近年来，人类群体智能在网络空间中得到了广泛的体现，例如：

2014 年，研究人员在《美国科学院院刊》（PNAS）上发表了 EteRNA，展示了利用群体的力量在游戏环境中设计 RNA 分子结构。基于群体智能开发的 UnanimousAI 平台可以来用群体的力量求解单项选择题，实现了更准确的肺炎诊断。

被广泛使用的维基百科是群体智能在互联网场景下应用的典型案例。自从 2001 年上线以来，维基百科已经囊括了逾百万条词条，编辑次数达到了 6600 万次，注册用户超过 300 万人，而管理员的数量仅 77 人。维基百科之所以能够取得成功，离不开环境激发效应和基于版本管理的信息融合等技术，能够通过大规模用户的持续协同不断提高词条的规模和质量。

数据集ImageNet是通过 AMT 众包平台构建而来，众包方法是由公司组织将原本由雇员承担的任务通过公开征集的方式外包给未知外部群体。众包方法之所以能够成功，是由于这些问题可以被充分分解或天然地表现为一组小任务，信息融合的难度较低。

近年来，以 Linux Kernel、Apache 等开源项目为代表的软件开源运动在世界范围内如火如荼地进行，大规模协作产生的开源软件的质量和系统规模均达到了较高的水平。开源软件的成功得益于开发信息的有效记录和管理，实现了自上而下的任务分解与自下而上的信息融合相结合。

然而，现有的互联网空间中的群体智能本质上是对互联网跨时空汇聚能力的利用。人们基于互联网的通讯能力，针对特定问题精心设计群体力量的利用方案，但对于群智规律和机理的认识和探讨则较为缺乏。

目前形成的网络空间的群体智能现象仍然处于相对比较初级阶段，与低等生物大群体完成的「跨越」式的智能程度提升差距较大。研究者也无法确保群智现象可以在人们的控制下重复发生。

同时，物理空间群智机理探索和网络空间的应用实践仍缺少有效的结合。网络空间关注如何利用群体的力量，物理空间则主要针对低等生物群智现象的观察和解释，目前还鲜有将二者结合的工作。

群体智能规律的工程应用✦

从工程技术学科的角度出发，研究人员试图利用群体智能规律解决实际问题。为了实现这一目的，需要研究以下问题：

（1）群体智能的形成机理是什么？

（2）群体智能能否成为求解问题的基本方法之一？

（3）如何构造求解特定问题的人类群体智能系统？

（4）群体智能的能力边界在哪里？

群体智能的定位与理解✦

理想形态的群体智能具有两种基本的性质，即「智能放大效应」和「规模可扩展性」，规模庞大的群体可以有效放大个体的智能。从本质上说，群体智能来源于自主个体之间的大规模有效协同。从哲学的角度来看，可以用「量变产生质变」来解释群体智能现象。从复杂系统的视角来看，可以认为这「涌现」和「自组织」也体现了自主个体的大规模协同。因此可以将群体智能理解为一种利用群体力量求解复杂问题的方法，无法仅依靠个体有效求解这种复杂问题，即存在「1+1>2」的放大效应。

从微观层次上看，群体智能呈现出两种基本原理：

（1）自上而下：当问题能够被很好分解时，不同个体之间可以进行分工协作，从而发挥每个个体的长处，大大提升整体效率。

（2）自下而上：个体都可以看到部分片段，具有关联性的不同信息片段融合后自然形成信息增加。

宏观层次上的群体智能是由大量持续出现微观层次群体智能现象（问题分解、群智汇聚等）复合形成的。凯文·凯利在《失控》一书中写道这是：「一种由默默无闻的零件通过永不停歇的工作形成缓慢而宽广的创造力」。

宏观群体智能的基本原理包含以下三点：

（1）探索：群体中的个体自主地对当前问题进行探索，得到该问题的一组信息；

（2）融合：所有个体探索到的信息通过某种方式被融合；

（3）反馈：融合活动产生的群体信息通过某种方式反馈给个体，刺激个体进行持续地探索。

在物理空间中利用群智机理的难度较大，可行性较低。首先，从表层意义上来说，物理空间中群体智能的可控性较差，时间跨度过大。从深层因素上说，在物理空间中召集足够参与者的成本太高，信息的传播速率太慢，信息依赖于具有足够宽广的知识面的重要人物才能融合。此外，物理空间的信息反馈是被动的，要求个体主动寻找信息。

网络空间的出现为更好地利用群体智能带来了可能。以较低成本汇聚足够多的参与者，信息传播速度足够快，从而形成了自发涌现的网络空间群体智能现象。

然而，如何在信息融合时降低对重要人物的依赖，将被动式反馈转变为主动式反馈成为了构建理想形态的群体智能要解决的关键问题。在理想状态下，每个个体能够自由探索，信息可以通过机器自动融合，并且可以根据个体的特点反馈。

理解群体智能的构造性模型✦

传统的群体智能研究（如环境激发效应）大多关注事后解释。在这里，研究者则尝试人工构造求解特定问题的群体智能系统。

群体智能的构造性模型 EIFL 如上图所示，「信息激发、信息融合、信息反馈」循环中，梅宏院士首先尝试有效激发每个个体提供问题相关信息片段的积极性，再对不同个体提供的信息进行有效融合，最后考虑如何将融合后的信息有效地反馈给每个个体。

根据群体智能发生的空间（物理空间、网络空间）和信息融合的方式（自然、半人工、人工），可以将群体智能系统按照如上图所示的方法进行分类。

在物理空间下，自然发生的群体智能现象包括蜂群筑巢，蚁群寻食等；半人工发生的群智现象则主要指些实验室环境下受到人工干预的自然界群体智能，尚未发现全人工产生的群体智能。

在网络空间下，原始的信息存储传播系统（例如，BBS、邮件列表、开源、众包等）都是自然发生的群体智能；半人工群体智能包括维基百科、前文提到的 RNA 设计等工作；而全人工的群体智能是一种理想状态，指的是互联网上具有高效信息融合和个性化信息反馈能力的系统。

根据群体的构成方式，可以将群体划分为以下三类：

（1）由自然生命体构成的群体：蚁群、人群

（2）由人造智能体构成的群体：机器人群体

（3）混合群体：人-机混合，低等生物-机器混合。其中，研究者通常将人类群体智能称为 Collective Intelligence，将低等生物或者非人类智能体的群体智能称为 Swarm Intelligence。

「探索-融合-反馈」系统的示例✦

如前文所示，可以基于「探索-融合-反馈」机制构建能够解答单项选择题的 Swarm AI 智能体。好比将问题的选项都放在冰面上，冰面上有一个铁质的冰壶，每个个体（选择的可能答案）都持有一个磁铁。在探索时，每个个体用磁铁对冰壶施加引力；在融合时，所有施加在冰壶上的力汇聚成一个合力；在反馈时，合力会导致冰壶发生移动，每一个个体可以观察到冰壶的移动。合力走向会影响每个个体的判断，每个个体观察冰壶的移动也可能改变主意。

EteRNA是按照游戏方式来进行 RNA 分子结构设计，有许多人参与，大约一周完成一次「探索-融合-反馈」循环。在探索时，每个个体在各自的工作空间中设计 RNA 分子结构并提交；在融合时，每个个体对他人提交结果进行投票，选出前 8 名，8 个设计方案综合在一起并采用特定的指标对综合结果进行评估；在反馈时，融合的结果对所有个体公布，个体在此基础上进行下一轮探索工作。

人类文明中知识体系的形成大体也遵循「探索-融合-反馈」的机制。对于任何一个问题、很多个体、小团体总在不断的探索和尝试。在某一个时刻，出现一个重要的人物，把探索结果汇聚起来，将前人的经验、实践结果融合成论著。论著被广泛传播以后又反过来改进人类对现实世界的认知。在互联网诞生后，人类的知识创新能力又得到了进一步提升。

基于群体智能的自组装✦

在电影《超能陆战队》中，存在一种磁力机器人，能够大规模聚集在一起，组成各种形状。受此启发，研究者也研究能否采用「探索-融合-反馈」的基本原理，通过构造性模型，实现大规模群体在非中心控制情况下的自我成型。

梅宏院士团队借鉴昆虫的「趋光性」设计了一种人工光场进行信息的融合和反馈。团队根据每个个体的当前位置确定光场状态，光场驱动个体进一步改变位置。

如上图所示，没有被占据的网格位置融合形成蓝光光场，已经被占据的网格融合形成红光光场，这是融合过程。每个个体可以得到周围局部光场的信息，并根据局部光场信息得到了反馈意见，再进行新的探索。实验结果表明，在具有充分多样性的形状的任务集合上，该方法展现出很好的效率、规模可扩展性、稳定性。

基于群体智能的拼图✦

拼图问题是一类复杂问题的典型代表，这类问题无法通过自上而下、集中控制的方式进行有效求解，不具有中间层次的可分解性，只能采取自下而上的方式求解。

基于「探索-融合-反馈」机制的群体拼图过程如上图所示。在探索过程中，每一个体自主进行拼图，拼图结果被表示为由图块以及图块之间的邻接关系形成的图；在融合时，所有个体当前时刻的拼图结果被融合在一起，形成当前时刻的群体观点图，个体遇到困难时，系统会显式地从当前群体观点图中获取共识。在反馈时，研究者根据个体当前时刻的拼图动作将当前时刻群体观点图中相关的具有较高可信度的邻接关系反馈给当前个体，与当前个体关注点相关的共识被用于即时辅助，作为响应式反馈。在后续的拼图过程中，随着问题求解的推进和群体共识的收敛，反馈会持续增强。

实验结果表明，当群体中的个体数在 1-10 的区间内时，拼图求解所需的时间与玩家数量成反比；以最强个体为基准，拼图效率提升了 31%-64%。

基于群体智能的知识图谱构建✦

知识图谱是人工智能领域的研究热点。目前，研究者还不能完成对专业领域的知识图谱的自动化构建，必须要求大量人类专家的参与。研究者尝试基于「探索-融合-反馈」的群体智能技术研发能够帮助知识图谱构建的工具。

在探索阶段，每个参与者根据自己的理解构建个体知识图谱，个体与个体之间的联系表现为节点和节点之间的带标签有向图。在每次探索活动中，个体根据自己的探索结果提供知识片段，建立并完善实体及其属性信息。针对未定义的实体/关系类型进行自定义补充。

在融合阶段，可以通过熵最小化形成对齐个体知识图谱。在多人协同构建知识图谱时，平台将多人构建的知识主动融合，形成群体知识图谱。

基于广义熵最小化的知识图谱融合算法，与当前最好方法比，在 Hit@1 指标上取得 1% 到 27% 的提升。通过在知识图谱融合中加入反馈响应信息，指标又有所提升。在包含 1-64 个个体的人类群体中，对四大名著等多个领域知识图谱进行构建：随着群体规模不断提升，个体构建效率和群体制品规模不断提升，算法表现出良好的规模可拓展性。

基于群体智能的软件开发✦

软件是一种具有复杂逻辑结构的人造知识制品，规模和复杂性持续增长，开发困难性不断增加。研究者试图研究能否将群体智能用于软件的生产和持续演化。

从某种意义上说，开源运动群体力量的应用示例。但是，当前开源过程中的智能程度仍然不够，对于个体智能的汇聚能力还远未达到期望的标准。

在国家自然科学基金委支持下，由梅宏院士牵头的团队联合北京大学、国防科技大学、北京航空航天大学、南京大学、北京理工大学开展了「基于互联网群体智能的软件开发方法研究」。

该研究关注的科学问题是：互联网环境下，软件开发群体智能的形成、度量、调控。该科学问题又可以被分解为以下三个重要的子问题：面向软件开发的互联网群体智能形成核心因素是什么？如何对群智化软件开发的质量和效率进行量化度量分析？如何对于群智化软件开发能不能进行有目的的调整、影响和控制？

该研究包含 5 项具体的研究内容：

（1）群智化软件开发基本原理与技术框架

（2）软件开发中海量信息的融合与反馈

（3）面向特定类型软件制品（代码、模型）的群智化构造

（4）群智化软件开发效用度量与优化

（5）群智化软件开发支撑环境与示范应用。

研究工作从两个视角展开：

（1）群智一般性原理：探索群体智能一般性原理在软件开发问题中的应用

（2）群体软件开发现状：从群体软件开发现状出发发现问题，提升群智能力。

代码管理中的群体智能研究✦

软件都是通过代码编写而成。以版本库为核心的群体软件开发是目前被广泛采用的软件开发方式，已经存在「探索-融合-反馈」的循环回路。在探索时，程序员针对特定软件开发任务，对代码进行修改，将结果提交至某个版本的分支；在融合时，采用经典的文本行差异比对算法将当前代码变更融合至目标版本分支；在反馈时，研究者将融合结果反馈给程序员，若存在冲突则进一步修改代码，消除冲突。然而，现在的「探索-融合-反馈」的循环回路的效率和质量仍不尽如人意。

以提升 EIF 回路的效率为目标，梅宏院士团队从以下三个方面展开了研究：

（1）代码变更智能融合：以图的方式表示不同版本的代码，采用图对齐算法对代码进行融合。在一方变更存在重构情况下，此方法可以实现88%正确率和90%的召回率。与基于文本的算法相比，冲突数减少60%，冲突行减少91%。与基于树的算法相比，冲突数减少12%，冲突行减少78%。

（2）代码变更智能分解：基于「关注点分离原则」，采用图分割算法对代码变更进行面向任务的分解，确保所提交代码变更的高内聚性。在无人工介入时，准确率达到了 71%-84%。

（3）代码变更智能分析与反馈：以图的方式表示带吗，挖掘代码图中的共性模式和异常点，识别潜在风险。

软件建模中的群体智能研究✦

模型也是软件的一种重要的存在形式。在当前主流的软件开发中，模型隐藏在代码中。从软件工程的角度来看，在理想的软件开发中，模型应该独立存在。软件建模与模型转换是软件开发的核心创造活动，模型是现实的抽象。代码是模型在特定运行环境中的「实例化」，存在大量琐碎的实现细节。

研究者试图探索以模型为核心、基于群体智能的软件开发方式。具体而言，会面临以下五项技术挑战：

（1）如何基于现有软件代码制品构造模型

（2）如何将多维度的模型进行组织和管理

（3）如何对外提供模型的查询和复用服务

（4）如何支持模型与代码之间的一致演化

（5）如何基于模型资产库构造与演化软件

该工作针对移动 App 场景展开，旨在通过富模型资产库的构造与应用，促进软件开发演化中面向模型的 EIFL 回路的形成。在模型构造阶段，重点研究模型的挖掘和融合；在模型应用阶段，重点研究模型的查询、模型制导的测试脚本更新、模型制导的代码更新等问题。

软件测试中的群体智能研究✦

当下的开源平台汇聚群智的能力仍然不足。在没有符合要求的国产开源平台进行测试的情况下，研究者采用了众包测试平台开展了一系列实验。

然而，当前的众测实践还没有形成高效、高质量的 EIFL 回路，更多依靠众测工人随即探索发现漏洞，缺少对工人群体提交信息的有效融合，缺乏对群体工作行为的有效引导和调控。研究者希望构建一种基于 EIFL 回路的群智软件测试机制与平台。

研究者根据测试问题特殊性，建立了人机协同机制，以测试报告为核心的迭代式的探索融合反馈回路，支持群体构成、测试需求及策略等动态调整。

目前，基于图文融合分析的测试报告融合方法在包含 5000 多个测试报告数据集上可以准确检测并聚合 87% 的重复报告。基于图文融合分析测试报告评估方法，与当前最好的方法相比有比较大的准确度提升，同时大幅降低了时间开销。

对于群体智能软件开发的思考✦

在对该项目进行复盘时，梅宏院士认为，该项目的难度远远超出了预期。究其原因，主要在于目前尚无完全「自底向上」的自由探索式软件开发的先例，自顶向下软件开发的任务分解难度大、缺乏统一标准，软件结构一旦形成便难以更改，缺乏满足要求的开源社区平台，众包软件测试任务复杂度远低于开源软件开发。

结语✦

在梅宏院士看来，群体智能是一种自然现象，是自然产生的。对群体智能机理的认识非常重要，利用好群体智能机理具有更加重要的工程意义。「基于互联网群体智能的软件开发方法研究」在群体智能构造性模型（EIFL）、人工群体智能（ACI）等方面取得了一定进展，在下游任务中进行了构造 ACI 系统的初步探索。

未来，梅宏院士团队将针对特定问题领域进一步探讨ACI的构造、评估，并探索群体智能的能力边界。希望面向软件开发场景，构造覆盖权全生命周期的系统。

文章来源于智源社区转自人工智能学家微信号

责任编辑：向太阳

特别申明：