深度学习作为人工智能的子领域,在自动识别水下传感器数据中的各类目标方面具有巨大潜力。本研究旨在通过双重路径推动水下作战领域自动目标识别系统的未来发展:首先展示技术可行性,其次结合实践建议与经验教训为研究人员构建定制系统提供洞见。目标读者群体为水下作战领域的研究者,涵盖深度学习或水下传感器数据的新手。深度学习基础可通过众多在线课程获取,本文献则聚焦如何将这些工具应用于迥异于机器视觉与自然语言处理常规场景的领域。此类水下作战自动目标识别系统处理的并非标准图像或文本,而是源自声学传感器的数据;其采用的小型定制神经网络需在相对有限的训练数据集上学习,且常受硬件算力制约——这与利用充足计算资源从海量训练集学习的现成可用网络截然不同。本文概述定制神经网络在多项水下作战自动目标识别任务中的应用,包括侧扫声呐中的类水雷物体识别、宽带声呐散射数据中的未爆弹药检测、被动声学数据中的水面舰船辨识,以及主动声呐中的水下目标识别。文中同时分享了针对水下传感器小样本训练数据的高效神经网络设计建议。

自动目标识别系统的进步可通过快速自动分析输入传感器数据,实现潜在目标的探测、分类与定位,从而提升水下作战能力。此举能在反水雷、被动声学监测、鱼雷防御及反潜作战等多样化应用中降低操作员负荷。深度学习对远程与无人平台的水下作战自动目标识别应用尤为前景广阔。随着咨询需求日益增多,本文件旨在鼓励并支持将深度学习技术应用于未来自动目标识别系统开发,以强化水下作战领域的国防能力。

图1:通过监督学习训练深度学习模型

自动目标识别(ATR)指应用算法或设备从传感器数据中探测目标的技术,最初为航空航天领域的前视红外、激光探测测距及雷达系统所研发[1]。该技术适用于多种水下作战(UWW)场景,可实现传感器数据中目标物体的自动识别[2]。在此语境中,"目标"通常指需关注对象(未必具有攻击性),例如侧扫声呐数据中的水雷[3,4]、沉船与水下物体[5];宽带声呐散射数据中的未爆弹药[6,7];被动声学数据中的水面舰艇与鲸类[8];以及主动声呐中的水下目标。历史上此类目标需由训练有素的操作员识别,ATR的目标在于减轻操作员负荷,同时提升识别速度与精度。

多种ATR技术与算法已被开发,常借鉴操作员识别方法从传感器数据中提取特征。深度学习作为ATR技术正日益普及。本文献应众多研究者及其他相关方咨询而撰写,旨在解答"如何将深度学习应用于水下作战"以及"神经网络'黑箱'如何实现功能"等核心问题。基于深度学习的系统不依赖人工设计特征实现ATR,而是通过学习训练数据集统计特征自动识别目标。在适当条件下,此类系统可达到甚至超越专业操作员的目标识别水平。

深度学习实现ATR的两大途径为:(1) 从零构建并训练深度神经网络;(2) 采用已训练完成类似任务的"现成可用"模型,通过迁移学习适配水下任务领域[9-12]。两者均具可行性,最优选择取决于具体应用场景[9-12]。后者虽流行却常被诟病为"黑箱"方案——因盲目套用现成模型易忽略三大关键:工作原理认知、优化方法掌握、规避大型模型过拟合与类别偏差等陷阱的能力[13]。本研究采用从零构建定制神经网络的方案,选择依据在于:远程水下传感器存在计算能力、散热及供电等硬件限制,且缺乏可直接迁移的类似现成模型。

深度学习作为机器学习子领域,隶属人工智能范畴[14]。机器学习系统均接收输入数据并生成结论输出,但其与传统逻辑推理系统存在本质差异:后者依赖预设逻辑规则推导结论,而机器学习系统基于训练数据集统计规律自主形成数据解读能力,无需预设数据处理规则。

深度学习通常涉及深度神经网络。人工神经元概念源自生物神经元,具备接收输入信号、内部处理及传输输出信号的功能。深度神经网络指在输入X与最终输出Yˆ之间存在多层隐藏神经元的网络架构(如图1所示)。神经元通过结合大规模训练数据集与反向传播算法的训练过程学习数据处理方式。训练细节超出本文范围,可参阅相关教材[14]及Coursera平台"深度学习专项课程"等在线资源[15]。训练完成后,深度神经网络可部署至推理模式,接收新输入数据X并推断对应输出Yˆ。

"识别"通常指基于既有认知对事物或人的辨识过程。在水下作战自动目标识别(UWW ATR)任务中,识别可涵盖探测、定位及分类的一项或全部环节。但无论对人类还是深度学习系统,识别过程皆非绝对二元化。人类可能通过"我相当确信那是安娜"等表述传递不确定性。深度学习模型的输出Yˆ常称"预测值",通常包含0至1区间的"预测概率"要素。二元分类的阳性判定阈值常设为0.5,但可依据误报率等需求调整。Yˆ取决于输出层激活函数,并与标注真实值Y共同参与损失函数的梯度计算(通过反向传播算法)。例如训练二元分类器识别图像中的安娜时,若输出预测值Yˆ=0.8,则对应真实值Y=1(标注安娜存在)或0(标注安娜不存在),据此计算损失值回传网络更新权重以优化识别能力。需强调:较高预测概率虽表征较强置信度,但未经校准——0.8的预测概率未必对应80%的正确率[16]。错误标注的训练数据会影响预测概率输出;当判别特征与分类结果不一致时,模型为最小化损失可能采取保守预测策略[17]。部分应用场景需增设输出项以量化不确定性(详见第2.1节)。

当前主流深度学习模型多针对计算机视觉与自然语言处理任务设计[14],难以适配水下环境的特殊挑战[10]。水声数据与自然图像的显著差异构成迁移学习主要障碍:例如能识别自然图像RGB三通道中数千类物体的复杂模型,在单通道侧扫声呐数据中识别类水雷物体时可能过度冗余。此外,大型深度学习模型的高算力需求制约其在远程水下传感平台的部署。因此,尽管预训练"现成可用模型"是多数应用的起点,本研究选择为特定水下作战ATR任务构建定制神经网络。

本文第2章概述加拿大国防研究发展署(DRDC)大西洋研究中心开发的水下作战深度学习ATR系统。第3章结合经验教训,为拟开展水下作战及相关领域ATR系统研发者提供实践建议。

成为VIP会员查看完整内容
2

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《军事场景中的视觉分析探索》2023最新124页技术报告
专知会员服务
81+阅读 · 2023年3月2日
雷达海面目标识别技术研究进展
科技导报
21+阅读 · 2017年11月13日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
36+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2011年12月31日
国家自然科学基金
35+阅读 · 2008年12月31日
Arxiv
170+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
464+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
169+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
36+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2011年12月31日
国家自然科学基金
35+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员