本研究探讨人工智能(AI)辅助军事情报分析工作的潜力。专用AI工具集成文本检索、自动摘要及命名实体识别(NER)功能。研究表明,在时间压力下,使用AI功能的实验组分析质量优于对照组,且其概率估计更接近专家评估值。尽管实验组分析结果与概率估计均显著更优,但未发现其对分析任务所使用信息来源的信心更高。最后,本文指出AI在军事情报应用中的局限性,尤其体现在处理模糊矛盾信息时的分析能力。

当前可获取的数据规模表明,军事情报领域必须应用人工智能(AI)(Gartin, 2019)。AI的效益源于多维度优势,需明晰其潜在附加值(Vogel等, 2021)。军事情报的核心职能是收集与分析信息,辅助军事决策者制定策略。从学术视角看,军事情报是融合政治学、经济学、社会学与心理学等多学科的交叉研究领域(Albrecht等, 2022;Svendsen, 2017)。

军事情报旨在通过信息采集与分析构建全面态势图景,包括他国武装力量数据收集、作战计划研判,以及影响本国安全态势的动向监测(Sadiku与Musa, 2021)。分析师承担情报数据收集、分析与呈现职责。AI技术发展为分析工具集成提供了多维支持可能(Cho等, 2020),预期将减轻分析师负担,使其聚焦于核心分析评估工作(Hare与Coghill, 2016)。需强调的是,AI应作为辅助而非替代工具,确保分析师始终理解评估依据信息(Blanchard与Taddeo, 2023)。

本研究基于专有AI工具deepCOM开展实验。该工具依托大语言模型(LLM),核心功能包括:语义搜索(支持直接提问并标注来源)、自动摘要(生成短句摘要定位相关文献)及命名实体识别(NER)自动标注(标记时间、地点、组织与人名)(Devlin, 2018)。当前AI已渗透几乎所有军事领域(Rashid等, 2023),人机交互成为关键研究方向,涉及多媒介信息传递与对话形式优化,旨在提升个体创造力、生产力与决策效能(Dell'Acqua等, 2025)。信任构建(McNeese等, 2021)与协同态势感知(Gorman等, 2017)亦是本研究重点。

相较于既有研究聚焦AI在大数据管理中的作用(Horlings, 2023),本文关注AI对人类分析评估的辅助价值。通过实验验证,探讨AI在军事情报分析中的增效机制,重点分析人机交互信任提升与AI透明度优化的路径。

全文结构如下:第二章基于情报周期理论解析军事情报分析流程;第三章阐释实验AI功能及其对分析师的支撑机制;第四章详述实验设计;第五章呈现实验结果;第六章讨论研究发现;第七章总结结论。

deepCOM演示器中支持军事情报的AI功能

deepCOM演示器是一款集成AI功能的军事情报分析工具,旨在辅助分析师工作。其实验性测试的AI功能如下:三项AI功能中,AI搜索与自动摘要基于大语言模型(LLM),第三项为命名实体识别(NER)。尽管德国情报机构因北约、联合国与欧盟等国际架构需使用英语工作,但其自产情报以德语生成,故deepCOM的界面与输出均为德语。

  • 文本数据库的智能搜索
    传统文本数据库搜索基于词频匹配(即“词袋模型”,BOW),搜索结果排序取决于关键词出现次数,而非语义关联(Qader等, 2019)。用户需将问题拆解为多个关键词输入(Bohne等, 2011),而非直接输入完整问句。此类搜索效率较低:首先,强制简化为关键词导致信息丢失(如介词、格位、数字与变位形式的省略可能影响结果);其次,流程不直观(无法像互联网搜索引擎直接输入完整问句);最后,仅依赖词频易返回含关键词但无关的文档。

AI搜索可解决上述问题:其能解析完整问句,减少信息损失。deepCOM的AI搜索基于LLM实现,根据问题复杂度呈现系统生成答案或直接引用原文。基于LLM的AI搜索答案不受问句措辞限制,且能处理同一实体的不同拼写(如阿拉伯专有名词的多种音译形式)。答案始终附带全文引用,提升可靠性并降低LLM“幻觉”(即生成看似合理但虚构的信息)风险。

  • 命名实体识别
    命名实体识别(NER)指从非结构化文本提取实体并分类至预定义类别(Lample等, 2016)。deepCOM的NER基于谷歌发布的Transformer双向编码器模型(Devlin, 2018; Yadav与Bethard, 2019)德语再训练版本,可自动识别时间、地点、组织与人名实体(无需针对特定语料库优化)。由于文本中实体常以变格形式出现,系统通过词形还原将其转换为基本形式以增强可比性(如Mittelmeers、Mittelmeere→Mittelmeer)。该功能整体运行准确,但偶见罕见实体分类错误或词形还原失误。军事情报中NER应用详见Nitzl等(2024a)。

NER可显著提升分析效率:自动标注替代耗时的手工标注,帮助分析师快速筛选有价值文献;阅读时颜色标注加速关键信息定位;提取的实体可在地图界面可视化,辅助事件定位与态势整合(支持热力图显示区域事件聚类)。

图:上图:NER自动从文本中提取时间、地点、组织和人名。中图:[德语]文本中已识别实体的颜色编码。下图:在地图上显示已识别的位置。

  • 自动文本摘要
    除全文展示外,deepCOM通过将每段压缩为一句,将文献长度缩减至原文1/3至1/2。自动摘要与NER目标类似——协助分析师快速评估文献相关性。摘要的详略取舍需根据具体场景权衡。

摘要功能由deepCOM后端LLM驱动,神经网络算法通过合并段落或删减句子生成连贯摘要。当前实现主要依赖句子成分省略,测试表明摘要质量总体良好,但偶现LLM训练数据引入的额外背景信息。

成为VIP会员查看完整内容
24

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《军事危机模拟中语言模型自由决策不一致性度量》
专知会员服务
19+阅读 · 2024年10月29日
《生成式人工智能和情报评估》
专知会员服务
83+阅读 · 2024年7月22日
《人机编队协同作战(MUM-T) 系统的等级和程序分析》
专知会员服务
91+阅读 · 2024年6月20日
《人工智能赋能空战智能体的可解释性》
专知会员服务
65+阅读 · 2024年6月5日
《人工智能在军事武器系统中的崛起》
专知会员服务
150+阅读 · 2023年3月21日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2009年12月31日
Arxiv
169+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
463+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
《军事危机模拟中语言模型自由决策不一致性度量》
专知会员服务
19+阅读 · 2024年10月29日
《生成式人工智能和情报评估》
专知会员服务
83+阅读 · 2024年7月22日
《人机编队协同作战(MUM-T) 系统的等级和程序分析》
专知会员服务
91+阅读 · 2024年6月20日
《人工智能赋能空战智能体的可解释性》
专知会员服务
65+阅读 · 2024年6月5日
《人工智能在军事武器系统中的崛起》
专知会员服务
150+阅读 · 2023年3月21日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员