本研究探讨人工智能(AI)辅助军事情报分析工作的潜力。专用AI工具集成文本检索、自动摘要及命名实体识别(NER)功能。研究表明,在时间压力下,使用AI功能的实验组分析质量优于对照组,且其概率估计更接近专家评估值。尽管实验组分析结果与概率估计均显著更优,但未发现其对分析任务所使用信息来源的信心更高。最后,本文指出AI在军事情报应用中的局限性,尤其体现在处理模糊矛盾信息时的分析能力。
当前可获取的数据规模表明,军事情报领域必须应用人工智能(AI)(Gartin, 2019)。AI的效益源于多维度优势,需明晰其潜在附加值(Vogel等, 2021)。军事情报的核心职能是收集与分析信息,辅助军事决策者制定策略。从学术视角看,军事情报是融合政治学、经济学、社会学与心理学等多学科的交叉研究领域(Albrecht等, 2022;Svendsen, 2017)。
军事情报旨在通过信息采集与分析构建全面态势图景,包括他国武装力量数据收集、作战计划研判,以及影响本国安全态势的动向监测(Sadiku与Musa, 2021)。分析师承担情报数据收集、分析与呈现职责。AI技术发展为分析工具集成提供了多维支持可能(Cho等, 2020),预期将减轻分析师负担,使其聚焦于核心分析评估工作(Hare与Coghill, 2016)。需强调的是,AI应作为辅助而非替代工具,确保分析师始终理解评估依据信息(Blanchard与Taddeo, 2023)。
本研究基于专有AI工具deepCOM开展实验。该工具依托大语言模型(LLM),核心功能包括:语义搜索(支持直接提问并标注来源)、自动摘要(生成短句摘要定位相关文献)及命名实体识别(NER)自动标注(标记时间、地点、组织与人名)(Devlin, 2018)。当前AI已渗透几乎所有军事领域(Rashid等, 2023),人机交互成为关键研究方向,涉及多媒介信息传递与对话形式优化,旨在提升个体创造力、生产力与决策效能(Dell'Acqua等, 2025)。信任构建(McNeese等, 2021)与协同态势感知(Gorman等, 2017)亦是本研究重点。
相较于既有研究聚焦AI在大数据管理中的作用(Horlings, 2023),本文关注AI对人类分析评估的辅助价值。通过实验验证,探讨AI在军事情报分析中的增效机制,重点分析人机交互信任提升与AI透明度优化的路径。
全文结构如下:第二章基于情报周期理论解析军事情报分析流程;第三章阐释实验AI功能及其对分析师的支撑机制;第四章详述实验设计;第五章呈现实验结果;第六章讨论研究发现;第七章总结结论。
deepCOM演示器是一款集成AI功能的军事情报分析工具,旨在辅助分析师工作。其实验性测试的AI功能如下:三项AI功能中,AI搜索与自动摘要基于大语言模型(LLM),第三项为命名实体识别(NER)。尽管德国情报机构因北约、联合国与欧盟等国际架构需使用英语工作,但其自产情报以德语生成,故deepCOM的界面与输出均为德语。
AI搜索可解决上述问题:其能解析完整问句,减少信息损失。deepCOM的AI搜索基于LLM实现,根据问题复杂度呈现系统生成答案或直接引用原文。基于LLM的AI搜索答案不受问句措辞限制,且能处理同一实体的不同拼写(如阿拉伯专有名词的多种音译形式)。答案始终附带全文引用,提升可靠性并降低LLM“幻觉”(即生成看似合理但虚构的信息)风险。
NER可显著提升分析效率:自动标注替代耗时的手工标注,帮助分析师快速筛选有价值文献;阅读时颜色标注加速关键信息定位;提取的实体可在地图界面可视化,辅助事件定位与态势整合(支持热力图显示区域事件聚类)。
图:上图:NER自动从文本中提取时间、地点、组织和人名。中图:[德语]文本中已识别实体的颜色编码。下图:在地图上显示已识别的位置。
摘要功能由deepCOM后端LLM驱动,神经网络算法通过合并段落或删减句子生成连贯摘要。当前实现主要依赖句子成分省略,测试表明摘要质量总体良好,但偶现LLM训练数据引入的额外背景信息。