金欣：指挥控制智能化——瓶颈问题和建议

点击：6303 作者：金欣来源：防务快讯发布时间:2018-10-05 11:37:55

2016年的AlphaGo事件掀起了国内对发展指挥控制智能化的一轮热潮。美国防部前副部长沃克也指出了人工智能技术在指挥控制中的应用潜能。时隔两年，指挥控制智能化究竟发展得怎么样？存在哪些问题？该如何解决？本文谨对国内外指挥控制智能化发展情况进行简要介绍，从工程化落地的角度剖析了发展中遇到的瓶颈问题，并针对性地提出了发展建议。文中的观点未必正确，只为抛出些问题，引发业界的思考。

近两年来，人工智能在围棋、游戏等领域获得的成功，激发了广大军事科研工作者的美好憧憬和积极探索。指挥控制与围棋、游戏同属于博弈的艺术，这在很大程度上引发了人们对指挥控制智能化的想象：激烈拼杀的战场上，有一双眼镜注视着战场上的一举一动，用一双无形的手控制着战场上的一兵一卒，凭借无双的智慧驱使战场态势向他期望的方向发展。这个人就是指挥员，是否未来有一天会由AI替代？当然这是终极目标，目前的共识是，在很长一段时间内，机器还只能扮演辅助指挥员和参谋的角色。

1.webp (19).jpg

指挥控制智能化概念图

无论如何，一个智能的大脑对于打赢战争的重要性是不言而喻的，智能指挥体系的贡献度将超越任何一型智能武器。美国防部前副部长沃克都指出“利用人工智能等技术，可以压缩指挥员在观察、判断、决策、行动（OODA）循环中的时间，实现多域联合作战指挥与控制的目标，以取得未来战争的制胜权。”

国内对于指挥控制智能化的热情高涨。从2016年到2017年，军口和民口的专家学者们多次坐在一起，围绕人工智能在军事领域的应用展开热烈的讨论。尤其对指挥控制智能化，人们寄予了厚望，但对其如何发展也持较大的争议。今年7月份在北京召开的第六届中国指挥控制大会上，一半以上的主题报告都是围绕指挥控制的智能化。

本文谨从一名指挥控制系统技术工程创新研究者的视角，来谈谈对发展指挥控制智能化的一些看法。

1.技术发展分析

一切还是要从AlphaGo说起。时间不长，从业者们应该还有这样的记忆。2016年以前，在指挥控制技术预先研究领域，凡提及智能化，总会给人留下炒作概念、务虚的印象。而自AlphaGo事件起，风向发生了180°逆转，言发展则必提智能化。“未来是智能化时代，要大胆想象，往智能化上面靠！”到处都能听到这句话。归根结底，是AlphaGo展现出的能力让人们看到了希望。前面描绘的那幕场景似乎正在栩栩如生起来。

一晃两年过去了,进展如何呢？美军在指挥控制技术方面独步天下，智能化发展起步最早，让我们先来看看美军的进展。自2014年第三次抵消战略提出以来，美军就十分重视发展人工智能技术，启动了大量AI相关的军事研究项目，如Insight、XDATA、Deep Learning、DEFT、PPAML、Mind’sEye、TRACE、 AWCFT、Premlin、LOCUST、Perdix、Loyal Wingman、CICADA、ANTS，Maven等。但主要集中在情报分析、无人平台、网络安全等应用领域，指挥控制相关的较少看到。美军并非不想发展指挥控制智能化，而是有所考虑、比较谨慎的。美军2016年发布的《自主性》研究报告中指出，AI可用于对部队和指挥官进行告警及提供行动方案的建议，但还远远没有达到能够代替人类制定决策的程度。这个观点是比较客观、务实的。

1.webp (20).jpg

《自主性》报告

截至目前，美军公开发布的信息中，与指挥控制智能化相关度较高的项目，主要有3个，分别是“深绿”、“指挥官虚拟参谋”和“阿尔法”。

（1）“深绿”（2007-2011）——仿真预测

“深绿”（Deep Green）是美军2007年启动的一项面向美国陆军、旅级的指挥控制领域的研究计划，受“深蓝”计算机战胜卡斯帕罗夫影响，取名“深绿”，旨在运用计算机仿真技术，推演预测未来态势发展的多种可能，帮助指挥员提前进行思考是否需要调整计划，并协助指挥员生成新的替代方案。其包括“指挥官助手”、“闪电战”、“水晶球”3部分。“指挥官助手”支持用户以手绘草图结合语音的方式快速制定方案。“闪电战”快速对作战计划及战场态势进行仿真推演，生成一系列未来可能结果。“水晶球”收集各种计划方案，更新战场当前态势，控制快速仿真推演。“深绿”计划可以视为美军发展指挥控制智能化迈出的第一步大胆尝试，可惜由于多方面原因于2011年被中止。

1.webp (21).jpg

“深绿”概念图

深绿的核心技术本质上是基于实时态势的动态仿真，亦称“平行仿真”。仿真擅长逼真地、量化地模拟大量实体行动的复杂作用机理和综合效果（很难用数学公式进行理论建模），从而实现对战争演变发展的智能预测。它无法预测敌方下一步会怎么做，但可以推测假如他这样做、我那样做，发展下去会是个什么结果，会出现哪些潜在的风险或机遇，如果提前采取某种策略，能否引导出比较好的结果等等。然而，要像“深蓝”那样遍历战场态势发展的可能性也是无法做到的。虽然“深绿”中采用了一些分支动态裁剪的方法，但仿真的运算量仍然很大，这可能也是导致计划中止的原因之一。

在俄军2017年的一篇报道中，“机器制造”公司提出了与“深绿”类似的解决方案，并且已经开展了一些实验测试，但并未公布测试结果及技术细节。

分析认为，仿真推演是一个潜在发展方向。虽然受模型逼真度、不确定分支组合爆炸等因素的制约，通过仿真“预见”到的未来可能会“跑偏”，但可供指挥员参考，是一项很有用的功能。且在计算能力大幅提升的当下，借鉴AlphaGo破解围棋复杂性的方法，或许不远的将来能够实现。

（2）“指挥官虚拟参谋”（2015年策划）——智能助手

“指挥官虚拟参谋”（Commander’s Virtual Staff，简称CVS）是美陆军2015年着手规划，计划2016年启动、2018年结束的新项目，是继“深绿”后美军发展指挥控制智能化的又一重要举措。

CVS借鉴Siri、Watson等产品理念，扮演类似参谋或助手的角色，旨在综合应用认知计算、人工智能和计算机自动化等智能化技术，来应对海量数据源及复杂的战场态势，提供主动建议、高级分析及针对个人需求和偏好量身剪裁的自然人机交互，从而为陆军指挥官及其参谋制定战术决策提供从规划、准备、执行到行动回顾，全过程的决策支持。

1.webp (22).jpg

“指挥官虚拟参谋”概念图

围绕陆军需求，项目规划的能力较为全面：1）指挥员专用工具：辅助指挥员理解、显示、描述、指挥的手持工具，可不受位置限制地使用；2）协作工作流：支持指挥员和参谋随处开展任务编排、跟踪、产品及任务交付物的生产和共享；3）数据汇聚：面向任务需求获取相关信息，提供给指挥员整合后的数据集；4）敏捷规划：领域无关的集成规划能力，支持战争博弈、准备、排演，及实现任务执行过程中的人机协作；5）评估：基于当前、未来及替代方案等，向指挥员持续提供计算机支持的在线评估；6）预测：基于态势数据和当前计划，识别和推理态势的演变，生成告警，和具有一定置信度的未来态势图（很可能是“深绿”的延续）；7）建议：基于特定领域知识自动生成建议，附上置信度评价及替代方案；8）机器学习和用户配置持续改进：更好的支持特定个人及组织的过程和偏好。

分析认为，CVS集中体现了美军规对虚拟助手这样一种新装备形态的构想，其中规划的后4项能力都与智能化指挥控制相关。但出于保密等原因，CVS项目已有的材料中对8项能力的详细描述较少，且后续相关报道几乎看不到，猜测正在秘密开展相关研究。

（3）“阿尔法”（2016年战胜李上校）——智能博弈

“阿尔法”（Alpha AI）是美国辛辛那提大学和空军实验室合作研发的一款智能空战系统。在一次模拟空战中，机器（红方）控制4架战斗机，与2名人类飞行员（蓝方）分别控制的2架战斗机之间进行对抗，获得了全胜。蓝方有预警机支持，且在导弹性能和数量上占优。红方则凭借巧妙配合，和超过人类250倍的反应速度反败为胜。对战中，蓝方施展出了钳形攻击等战术配合，以及在躲避红方导弹的同时抢占有利阵位的技巧。

1.webp (23).jpg

“阿尔法”空战界面截图

“阿尔法”采用的核心技术是遗传模糊树（Genetic Fuzzy Tree）。其中，核心算子是模糊推理，即通过类人的模糊逻辑思维，生成超视距空战中主动攻击、机动规避等攻防态势下的飞机航路规划、导弹攻击、武器选择等战术策略。所采用的训练方法是遗传算法，即通过继承和变异产生大量新的战术规则，在对抗实验中进行优胜劣汰，实现规则库的训练优化，提升战术策略的有效性。在模糊推理系统之间采用了树型级联架构，指数级减小了规则库的规模，从而大幅提升了算法的效率，能够在廉价PC上运行。

从对抗场景的设计来看，“阿尔法”可以视为战术编队指挥控制，相对简单。但和围棋相比，战斗机控制起来要复杂得多，实时性要求也高得多。项目团队经过了多年研究，尝试了众多方法，迭代了很多版本之后才达到这样的水平，虽然相对于实用还有较大距离，但为指挥控制智能化提供了一种实现途径。

（4）DARPA的新动向——游戏之路

游戏AI近年来发展迅猛。AI在大部分游戏领域都击败了人类，包括Atari、星际争霸、DOTA等。智能博弈技术的突飞猛进吸引了美军的目光，并采取了一系列相关举措。

2017年4月，DARPA发布征询启示，寻求推进当前的推演、建模和仿真能力。国防部一般用推演的手段探究战略决策制定和战术概念开发，用建模和仿真评估系统性能或训练。大部分推演和建模仿真活动可以利用商用视频游戏团体在架构、游戏概念和人工智能方面的创新，包括对人员决策的抽象化和自动化，以及开展自学习用于决策创新的方法。

2018年5月，Siri软件的创造者之一斯坦福研究所（SRI International）加入了DARPA，计划用《星级争霸》游戏训练AI，成功后会尝试迁移到现实中执行类似任务。再看《星际争霸》等策略游戏领域，AI发展非常迅速。暴雪等大型游戏公司开放游戏样本数据、开源游戏AI接口、举办游戏AI赛事，起到了很大促进作用。阿里研发的BiCNet已经学会了避碰协调移动、打跑结合、掩护进攻、集火攻击、跨兵种协同打击等战术规则。

1.webp (24).jpg

BiCNet学会的掩护进攻战术

DARPA的新动向耐人寻味。一个军事创新机构玩起游戏那么来劲，肯定是有目的的。《星际争霸》之类的即时策略（Real-TimeStrategy，简称RTS）游戏，相比棋类游戏更贴近真实战争博弈。虽然逼真度不如CMANO、LockOn等战争题材游戏，但将博弈策略的运用发挥到了极致，很多精巧的战术设计凝结了众多玩家的智慧。玩家不但要在微观层面熟练操控兵力行动，还要在宏观层面具备战略眼光，这些本质特性与作战指挥是一样的。如果快速发展的游戏AI能成功用在作战指挥控制中，对发展指挥控制智能化将起到很大的推动作用。

2018年6月的一份最新报道中提到，目前美军作战训练数据库中已有的数据并不支持机器学习和其他人工智能算法。对此，美海军陆战队正在研制“雅典娜”，一款专门用于训练、测试未来人工智能应用的推演平台，用以获取测试用于军事决策的人工智能应用程序的大量数据。它提供了一系列战争游戏，用于收集玩家数据，优化人工智能应用程序。一旦有足够的数据量，“雅典娜”就可以自行模拟现代军事行动，并提出新型战术。

分析认为，博弈实验平台已成为训练和测试人工智能应用程序的一种与有效方法途径。正是因为面临缺数据的瓶颈问题，同时看到了这一新途径，促使美军推出了上述的一系列举措。这些举措可以视为美军在为发展指挥控制智能化探路、打基础。待民用领域的相关技术成熟后再向军用迁移，就会水到渠成。

（5）国内发展概述

自AlphaGo事件之后，国内对AI技术的军事应用热情日益高涨，指挥控制领域也不例外。军方单位联合科研院所围绕智能战争主题多次展开探讨。包括2016年国防大学主办的第七届全军“战争复杂性与信息化战争模拟”高层学术研讨会、2017国防科技大学主办的“武器装备人工智能应用研讨会”、以及2016、2017、2018三届中国指挥控制大会等。军事专家与民口AI专家、企业代表汇聚一堂，共话军事智能。许多专家都对AI技术在指挥控制方面的应用描述了很多设想，但也有不少专家指出了发展存在的问题。

2.瓶颈问题分析

技术的飞跃让人们看到希望，而现实的难题又令人们陷入迷茫！美军同时拥有世界上最先进的指挥控制和AI技术，但在指挥控制智能化的道路上也是艰难前行。

回过头来再看AlphaGo就会发现，棋类博弈与真实战争差别太大，照搬其方法成功可能性很小。最大的问题还是复杂度。围棋的复杂度是10170，比宇宙的原子总数还多，但跟作战指挥相比简直是小儿科！《星际争霸》游戏的复杂度大约在102000级别，但和真实作战相比还是简化了太多。不论是兵力数量规模，还是指挥层级、武器的控制参数等都不在一个层次上。中科院自动化所在智能兵棋方面取得的进展难能可贵，但所使用的兵棋相对真实战争仍然做了太多简化。真实作战指挥的复杂度，也许只有上帝知道！此外，真实战争博弈还存在多元参与、动态非回合制、环境不确定、信息不完整且不透明、博弈对抗弱规则性、胜负难判定等诸多问题，非棋类博弈可比。从这个角度看，AI技术尤其是智能博弈这方面，还远没有成熟。

看待指挥控制智能化发展的难题，不同视角会得出不同的结论。笔者根据在指挥控制工程应用创新领域的研究经验，从新技术落地发展的角度，指出当前发展指挥控制智能化面临着三大瓶颈问题：缺样本数据、缺验证手段、缺方向指导。

其一，缺样本数据。这一点在业界的共识最为强烈。巧妇难为无米之炊，机器难学无据之道。AlphaGo采用的深度学习技术是个“大胃王”，要吃掉数以千万计的样本数据才能学会下围棋。作战指挥的复杂度要高得多，而样本数据又有多少？让我们来分析一下。眼下处于和平时期，靠打仗积累数据发展AI是不现实的。目前已有的数据主要来源于日常值班、实兵演练、模拟训练等渠道的积累。在作战指挥控制领域，目前已有的数据主要来源于日常值班、实兵演练、模拟训练等渠道的积累。然而，这些积累尚不足以有效支撑机器学习。日常值班中遇到的大部分都是一些例行活动，即便有对抗也是一些小摩擦，博弈对抗的规模和激烈程度都很低，且已有数据缺乏标注。实兵演练耗资大、耗时长、安全风险高，不可能大批量开展。样本数量规模和多样性有限。各大军事指挥院校都配有模拟训练系统，日积月累的训练数据规模可观。但采集记录的数据内容有较多缺失、缺少标注，且训练科目大都是针对教学目的设置，可定制性差。是只有我们国家才这样吗？美军拥有全世界最丰富的实战数据积累，但其国防创新试验小组（DIUx）却指出“现在限制AI在军事领域应用的关键就在于：短时间、强对抗的交战环境能够提供的机器学习样本数量太少，导致AI难以在对抗环境中施展”。缺数据这个问题放在任何一个国家都是绕不过去的坎儿。

其二，缺验证手段。这是个不可忽视的问题。美军一再强调技术验证的重要性，不加验证的发展新技术是把双刃剑，可能会加快研发速度后发居上，但也可能在实践中获得惨痛的教训，这种发展是很难持续的。但美军却在如何验证智能化技术上犯了难。过去的自动化完全依照人工设计的规则运行，可靠性尚能保障。智能化则要求能够独立处理新问题，并具有学习能力，因此势必产生人预料之外的结果，加之处理的往往是复杂问题，结果是否可信连人都很难评判。传统方法用于指挥控制AI算法的验证评价不太适合。单型装备或单项系统功能，可以放到真实的靶场或量身定做的仿真环境中做测试。而指挥控制算法的效果，需要通过一个兵力体系的综合行动来体现，并且要放到对抗的环境中去检验。对于AI算法，通常需要做大样本实验，测试其泛化能力和可靠性。这样的实验放到真实环境中成本代价太大以致无法实现，只能在仿真环境中做。另一方面，验证指挥控制AI是否可信、水平高低，目前缺乏合适的、可量化考核指标。例如，态势判的准不准、决策做的对不对，即便没有AI，纯粹在人的层面，也无法给出公认的度量。指挥决策的效果只有从对抗结果中体现，很难拆开单独测试。

其三，缺方向指导。这个问题客观存在，尤其是技术研发人员体会深刻。美军公开的资料大多描述的都是比较宏观的能力特征，技术细节描述很少。用AI技术解决具体应用问题，如同道家炼丹，需要吸天地之灵气，需要有一个人同时对问题域和技术有着深刻领悟，方能一举成功。AlphaGo的创始人德米斯·哈萨比斯既是国际象棋神童，也是神经科学专家，还是AI企业家。正是这些积淀的融合，让其诞生了AlphaGo的灵感，针对围棋量身定制设计出了蒙特卡洛树搜索+深度强化学习的方法，所谓好办法用到了对的问题点上。然而目前，同时对作战指挥和AI技术有深刻领悟的人少之又少，在AI应用选点方面能够提出的指导意见也很有限。随意选点开展研究是有风险的，没有找到正确的发力点和正确的方法，会拖延成果产出的时间周期，过长的等待或过多的反复会让用户失去信心。如果指挥控制智能化领域多年后依然拿不出可实用化的成果，言必避及智能化的现象可能会再度出现。

三大瓶颈问题，说到底是缺乏战争博弈实践——人都说不清楚，指望机器说清楚，在短期内是很难做到的。

3.解决途径建议

基于上述分析，笔者认为，要解决上述瓶颈问题，做深做实指挥控制智能化技术研究，要从四个方面努力。

1.webp (25).jpg

解决途径建议

首先，积累足够规模和质量的样本数据。没有米，就从种水稻开始。笔者建议，从三方面同步开展数据采集和积累工作。首先，加强日常值班和实兵演练数据的采集备份。真实数据的最大优点就是可信，用它训练出的AI可用性强。但是目前数据采集工作还有待加强，采集数据内容的全面性和详细程度还有待提升，数据的存储备份机制还有待完善。其次，加强兵棋推演数据的采集。结合军事院校的教学训练，以及全国和地方性的各种兵棋推演赛事，有主题、有针对性地采集教官、学员、参赛选手的推演数据。例如指控学会主办的全国兵棋大赛就是采集积累指控样本数据的优秀范例。再次，探索通过自主博弈对抗实验产生数据的新方法。借鉴AlphaGo Zero的思路，打造高仿真度的博弈实验环境，综合人工规则和机器学习实现机器对机器的自主博弈对抗，全天候地开展自动化的博弈实验，快速产生海量样本数据。然后再通过学习不断优化规则，提升对抗的智能水平。该方法的优点是成本低、强博弈对抗性、造数据效率高、对抗场景可灵活订制、仿真度可持续提升等。虽然技术尚不成熟，但代表未来发展方向，建议聚力攻关！

其次，建立数据的自动化标注和受控共享机制。目的是将原始数据变为高可用性的公共财富。首先，研究指控数据自动化标注技术，让数据可为机器学习所用。包括数据的清洗、抽取和标注等方面。其中在标注方面还有很多问题值得研究。例如，针对战争的延迟回报特性（决策的效果往往不会立即显现），如何设计评价标准？如何将指挥人员在推演过程中互相交流的信息、心理活动、阶段性筹划产品等采集下来作为标注？在保证专业性的前提下，如何引入众包机制？等等。其次，建立密级数据的受控共享机制，让数据可为更多人所用。指控数据的密级特征，让共享利用、众包形式的标注变得十分困难，要从技术和机制层面共同下功夫。在技术层面，可以研究指控数据的脱密、降密技术，滤除敏感信息的同时保留有用信息。在机制层面，需要建立数据共享渠道，按知悉范围建立精细化的数据访问权限体系；提供保密的训练环境，算法可以拿进来训练，数据只能留存在保密环境中；建立数据的评价机制，根据使用记录、用户评价推荐优质数据集，并给与一定的奖励。

再次，建立指挥控制AI算法的验证评价体系。如前所述，传统的实践检验方法用于智能化技术比较困难，因此需要创新。首先，创新验证技术手段。一种可行的方案是构造逼真的仿真试验环境，用于机理验证，等技术成熟后再到真实环境中去检验。例如前面提到的博弈实验环境，既可以造数据，也可以用于试验验证。AI算法孰优孰劣，打一仗PK一下就知道。相同的兵力、对手和环境下，算法定胜负。其次，创新评价指标体系。一是从验证的角度，如何评价AI算法的置信度，例如对敌方实体键的关系、意图、能力、行动趋势等要素判断得对不对、准不准，放到真实作战环境下，这个算法能不能用，会不会得出不靠谱的结果。二是从选拔的角度，如何评价算法性能的优越性，例如策略的运用、方案的设计、行动的控制好不好、有多好等，如何给出量化的评价结果。

最后，建立联合与竞争并存的生态。在军民融合的发展趋势下，联合是主旋律，但竞争也无处不在。首先，指挥控制智能化难度大，只有集中力量才能办成大事。建议组建“军方+工业部门+AI企业+高校”的联盟。其中，军方负责需求牵引，组织推进重大专项研究。工业部门依靠强大的研发力量，担纲整个研发环节。AI企业提供常态化的技术支持，将民口成果转化军用。一流高校提供理论方法创新，保持技术前沿，开放交流促进步。其次，只有建立竞争的生态，才能保持旺盛的发展势头。可以围绕智能指控技术难题设立赛事，借助外脑，发挥群智攻关。可以每年组织各种竞赛、开源AI接口、开放数据集，形成良好的AI发展生态环境。通过竞赛发现新的技术突破点、挖掘优秀人才团队、扩大影响力。优秀的范例如指控学会每年举办的全国性兵棋大赛、中电28所举办的军事阅读理解挑战赛等。

4.总结

随着人工智能技术的进步，发展指挥控制智能化是迟早的事。AlphaGo事件让这一节点提前到来，掀起了一波热潮。然而冷静下来分析却发现，不论是技术本身，还是数据积累、验证体系都尚未成熟，构成了制约发展的瓶颈。要做深做实指挥控制智能化技术研究，首要的是在数据积累手段、验证评价方法上积极创新，建设联合与竞争并存的良好发展生态。在指挥控制领域用好人工智能，需要技术人才和军事专家互相融入对方的语境、共同领悟问题的本质精髓，更需要对发展指挥控制智能化的执着信念，和求真务实的心态。本文的观点未必正确，希望对国内从事指挥控制智能化技术研究的同行们有所启发。

责任编辑：红星

特别申明：

1、本文只代表作者个人观点，不代表本站观点，仅供大家学习参考；

2、本站属于非营利性网站，如涉及版权和名誉问题，请及时与本站联系，我们将及时做相应处理；

3、欢迎各位网友光临阅览，文明上网，依法守规，IP可查。

作者相关信息

金欣：指挥控制智能化——瓶颈问题和建议

2018-10-05

内容相关信息

金欣：指挥控制智能化——瓶颈问题和建议

2018-10-05

北京航空航天大学王田苗教授：当前智能机器人发展若干挑战性问题