战场物联网(IoBT)的发展为增强态势感知创造了新机遇。为提升IoBT在关键决策中的态势感知潜力,需将设备数据转化为用户端可读信息对象,并按需提供访问。为此,提出利用自然语言处理(NLP)技术查询数据库并返回自然语言响应的工作流程。该方案采用适配边缘设备的“大型语言模型”(LLMs)执行NLP任务,并选用特别适用于IoBT动态连接网络的“图数据库”架构。本系统运用LLMs实现双重功能:将自然语言问题映射为Cypher数据库查询语句,同时将数据库输出总结为自然语言反馈。在代表美国陆军多用途传感区(MSA)公开数据的数据库上评估多款中型LLMs的表现,观察到Llama 3.1(80亿参数)在所有指标上均优于其他模型。最关键的是,本方案通过两步处理机制放松了对生成Cypher查询与真值代码“精确匹配”(EM)的要求,实现了19.4%的准确率提升。该工作流程为在边缘设备部署LLMs奠定了基础,支持通过自然语言交互获取关键决策信息对象。
当前针对物联网(连接温度传感器至移动设备的互联网络)的研究日益增多。海量设备产生巨量数据集,需要强大存储、处理与分析能力。由此衍生的洞察可增强环境“态势感知”并优化决策[1]。军事环境中实时数据处理与分析至关重要,尤其在IoBT网络存在间歇性连接时——此时“边缘设备”通过本地处理数据突破云计算限制[2]。LLMs在其它领域的显著优势在于能从庞大数据集提炼有效信息[2]–[4],并能根据自然语言问题生成特定代码输出[5],这对将自然语言提示转化为数据库查询具有重要意义。本研究旨在确立LLMs在设备端处理IoBT生成数据的性能边界:首先选用“图数据库”构建模拟IoBT结构(其动态节点管理能力优于SQL数据库),图数据库支持网络动态更新,高效处理深度互联的“多关系数据”,其可扩展性确保查询仅针对相关图段执行(而SQL数据库会因数据量增长导致“连接操作”性能下降),且更有效处理层级数据关系。
在多种图数据库中,本研究聚焦Neo4j数据库及其Cypher查询语言[6]。“Cypher查询语言”(CQL)是专为图结构设计的成熟查询语言。现有研究主要集中于利用LLMs实现自然语言到Cypher代码的映射[7]–[11],当前多数LLMs均具备CQL处理能力。本工作核心目标是构建人机数据库交互界面:1)自然语言问题转为数据库查询 2)将数据库输出与原始问题结合生成自然语言响应。该系统设想将实时IoBT数据存入设备或邻近网络数据库,作战人员可直接用自然语言查询。LLMs先将问题转译为Cypher查询语句,返回结果再与原始问题融合生成最终响应,为非专业用户提供高效IoBT数据访问通道。
第二步使用LLM放松了Cypher生成的“精确匹配”要求——当Cypher查询正确提取核心信息及辅助数据时,即使形式不完全匹配,数据库响应仍包含正确答案所需内容。第二阶段的LLM可从响应中提炼有效信息回答用户问题。本研究探索适用于战场设备端的轻量化前沿模型,实现在无云端支持条件下提供免数据库知识的自然语言接口。
核心贡献包括:
• 设计、实施并评估面向设备端计算的动态数据库自然语言查询流程
• 测试LLMs生成Cypher代码提取数据的能力
• 验证LLMs将数据库响应重构为自然语言句子的性能
• 建立LLMs与图数据库交互的评估框架
本方案仅需提供数据库模式及单条查询示例即可驱动小模型生成Cypher语句,并采用“零样本模式”评估方案以契合IoBT场景的严苛资源限制(如设备功耗约束)。
图:数据库自然语言交互工作流。