1. 物理AI介绍

《创新与适应性作为军事成功的关键因素：来自俄乌战争的战略洞见》报告

人工智能的出现将如何塑造地缘政治竞争的逻辑，尤其是在大国之间？各国已经开始将复杂的人工智能系统纳入其军事态势、外交工具包和决策过程。在哈佛大学肯尼迪学院，一个由阿纳托利·列夫辛组织、隶属于贝尔弗中心"新兴技术、科学进步与全球政策"项目的研究小组，致力于通过探究人工智能在军事化讨价还价和危机外交中的替代性用途，来理解这些变革。本白皮书报告了他们的发现和政策建议。

将人工智能整合到国防和国家安全领域正成为全球优先事项。就本报告而言，将人工智能定义为能够执行通常需要人类智能（如感知、学习、推理和决策）的任务，并能在动态环境中以不同程度的自主性运行的数字或物理系统。据估计，全球人工智能军事支出在2022年至2023年间翻了一番。军队正在利用人工智能以实现更高的作战效率和准确性，从而获得对抗对手的战略优势。然而，这些努力并非新事物。在1966年至1972年间，斯坦福研究所开发了"摇摇晃晃"机器人，它使用计算机视觉和语言处理来感知和理解周围环境，并做出决策和执行任务。20世纪80年代末，美国开发了"动态分析与重计划工具"——一款旨在优化人员与物资运输的人工智能软件。与此同时，自主机器人和无人机等无人武器系统也处于研发中。

然而，在2017年之前，人工智能远非战略军事优先事项。2017年4月，美国国防部设立了"算法战跨职能小组"，以加速国防部对大数据和机器学习的整合。几个月后，俄罗斯总统预言，人工智能领域的领导地位将成为未来全球主导权的关键。或许最具意义的发展并非来自政治层面。2017年6月，谷歌发布了一篇题为"注意力就是一切"的开创性论文，介绍了Transformer架构，这是一种彻底改变了人工智能产业的深度学习架构。它使得创建称为基础模型的通用语言模型成为可能。与为单一、特定任务设计和训练的传统人工智能模型不同，基础模型被构建为通用型。这意味着它们能对训练数据中的模式、结构和关系有广泛的理解。基础模型最突出的例子包括Anthropic公司的Claude、谷歌的Gemini和OpenAI的ChatGPT。基础模型可以针对各种用例进行定制，包括军事应用。

这一发展产生了三个广泛的影响。首先，快速准确地处理海量数据的能力开启了一个充满新颖军事应用的世界。在"注意力就是一切"论文发表不到十年后，以色列的"薰衣草"和"福音"系统或Palantir公司的"MetaConstellation"平台等人工智能驱动的解决方案已在实战冲突中部署，用于精确目标锁定。人工智能的其他用例还包括兵棋推演与可信战略生成、装备维护需求预测以及后勤规划。其次，基础模型降低了经济规模较小国家将人工智能整合到军事领域的门槛。打造可用的人工智能模型需要大量人力资本、研究计算资源和高质量数据。这种高昂的初期成本，加上先进模型训练所需尖端硬件的出口管制，使得较小国家难以构建自己的人工智能模型。虽然谷歌、Meta和OpenAI等领先的私营公司最初禁止将其模型用于军事目的，但这项限制后来已被解除。这为较小国家授权使用专有模型用于军事应用创造了机会。

第三，复杂人工智能系统日益融入各国军队，使得科技公司在决策高层获得了席位。私营部门在整个人工智能产业链上相较于公共部门具有显著优势。从设计和生产加速深度神经网络训练的关键硬件——图形处理器，到组装和训练前沿人工智能模型，Alphabet、Anthropic、Meta、微软、英伟达和OpenAI等几家大型公司主导着人工智能产业。世界各国政府越来越依赖私营部门的基础设施和专业知识来实现军队现代化。Meta、OpenAI和Palantir公司的高管被任命进入新成立的美国陆军"201支队执行创新团"，这表明了私营部门在美国国防和国家安全领域日益增长的地位。因此，国家安全越来越依赖于这些强大科技公司的创新能力、伦理标准和商业决策，这给国家带来了新的制度依赖和治理挑战。

有理由推测，人工智能将在战争中带来一系列切实益处。深度学习的进步有望提高目标锁定精度、增强态势感知并加速决策。它们有可能降低目标误判的发生率，并减少对平民造成意外伤害的可能性。有几个人工智能应用是专门为减轻附带损害而设计的。这些系统利用传感器集群、行为分析和生活模式评估来探测流动的平民，并识别指定视觉符号。此类自动化警告系统可以在检测到风险因素时暂停交战。

然而，人工智能的军事应用仍然充满伦理和法律挑战。围绕自主武器系统和基于人工智能的决策支持系统的法律护栏仍在制定中，并且必须建立在完善的法律伦理框架、政策、公约和传统之上。这留下了监管真空，加剧了违反战争法核心原则（如战斗人员责任、武力相称性原则和非战斗人员豁免权）的风险。此外，过度依赖人工智能辅助决策会招致意外军事交火的风险，从而导致不可预测的冲突升级；这反过来又限制了通过有意义和及时的外交解决螺旋式升级危机的空间。最后，通过分发复杂的开源模型实现的人工智能民主化，使得非国家行为体获得了更强的破坏能力。

鉴于人工智能不可避免地融入军事领域，建立强有力的监管和伦理保障措施对于减轻其负面影响至关重要。本报告将探讨人工智能多样化的军事应用，评估当前的监管格局，审视其中的法律和伦理困境，并提出确保其负责任实施的策略。

提纲

人工智能的军事应用
监管格局
美国法规
碎片化治理
战略风险与监管挑战
关于负责任军事人工智能的建议
I. 优先考虑“合规性内嵌”与伦理工程
II. 制定充分的测试与认证标准
III.确保透明度与可解释性
IV. 强化问责制的法律与政策框架

成为VIP会员查看完整内容

AI与军事 · 俄乌战争 · 军事创新 ·

今天 14:26

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

在经历了超过十年的冲突以及俄罗斯乌克兰战争全面爆发超过1000天之后，与该战争相关的媒体报道和研究常常是事件驱动性的，并且在很大程度上忽视了军事战略层面。交战双方的领土得失、关于提供特定武器系统的长期讨论，以及近来围绕和谈的效用、时机与目标的争议，主导了当前的辩论。然而，这场冲突对欧洲安全架构的中长期军事战略影响，尽管将产生深远后果，却几乎未被公众讨论。在乌克兰，总体战的概念重新出现，战争影响着生活的方方面面。正因如此，加之军事与非军事手段的快速技术进步及其运用的同步性，对俄乌战争进行战术、作战和（最重要的）战略层面的评估势在必行。从对俄罗斯与乌克兰（其在战争初期被认为不可能长期防御）之间的战争分析中，可以得出哪些战略洞见？

本研究基于这样一个假设展开：迄今为止的战争进程表明，有两个战略因素是成功驾驭现代冲突的基本先决条件，并且亟需更深入地审视：即通过“适应性”和“创新”进行变革的能力。然而，这些概念并不新鲜，无论从军事还是科学角度看都是如此。许多研究论文、国防政策，都指出了在现代冲突和战争之前及期间，提高武装力量、经济和社会适应与发展能力的必要性。

这是有充分理由的：自工业革命以来，历史实例表明，技术、经济乃至整体社会能力对军事的适应性和创新力有影响。因此，在过去，一个国家的经济和技术衰退常常伴随着军事停滞。传统上，民用和军用技术的发展遵循相同的范式，并且这两个部门在很长一段时间内相互依存。没有强大的经济与杰出的科学发展相结合，就不可能利用军事创新在冲突中给对手制造战略挑战，或通过创新优势预先可信地威慑对手，也不可能灵活、快速且成功地适应敌方的军事创新。

下文，将以在俄罗斯和乌克兰武装力量中观察到的“创新”与“适应”这两个类别，概略性地阐述这些以战略为主的变革能力。随后，将概述德国目前在创新与适应方面的军事战略变革能力。最后，将基于从俄乌战争中汲取的经验教训，提出改进德国适应与创新能力的措施。在此过程中，聚焦于战争的条令与技术动态，但并非否认战术与作战层面及其相应评估的重要性。目标是为德国能从俄乌战争中获得哪些军事战略洞见的辩论提供推力，并希望总体上鼓励延续对第三方战争的军事战略评估。

俄罗斯的适应与创新之道

俄罗斯在对乌克兰战争中展现的军事战略变革能力，本质上主要是条令性的，仅涉及有限的技术创新。截至目前，技术创新仅限于对已经过实战检验、并经过小幅改装的军事资产和武器系统进行实施和规模化运用。

俄罗斯在2022年2月旨在压垮乌克兰的初始方案，计划是使用高度机动但无法维持长时间作战的空降部队快速占领基辅。同时，动用了被称为“营级战术群”的、基本可自持的战术编队，以击破据称薄弱的乌克兰武装力量抵抗。为使“特别军事行动”成功，俄罗斯在冲突前就努力削弱乌克兰军队，并通过混合与常规手段破坏乌克兰社会的稳定。自占领顿巴斯部分地区和克里米亚以来，甚至更早，俄罗斯就一直试图通过信息宣传、网络攻击、情报活动和破坏行为来削弱乌克兰民众和武装部队的抵抗意志。此外，俄罗斯有步骤地激进化并利用了政治反对派。破坏乌克兰稳定性，最终旨在为俄军部署提供依据。这些做法沿袭了苏联的非线性战争惯例。

行动前夕对指挥控制设施、工业设施、仓库以及雷达和防空阵地的电磁、海上、空中和地面攻击，旨在最大限度地削弱乌克兰武装部队的军事潜力，并确保俄罗斯地面部队以最小损失进攻乌克兰。在全面战争前夕，俄罗斯评估其混合与常规准备措施都已足够成功。然而，由于乌克兰部队在攻击开始前已分散部署，以及俄罗斯武装部队方面对进行恰当的战损评估的忽视，这些准备工作被证明远不如俄罗斯总参谋部预期的有效。正如众所周知，这一战略误判正是俄罗斯初期压垮乌克兰的战略失败的原因。

行动之初，乌克兰既未被震慑而瘫痪，也未出现武装部队瓦解的迹象。因此，乌克兰政府并未投降。训练有素、装备精良的俄罗斯空降部队在对霍斯托梅尔机场的初期突袭成功后不久，便在乌克兰首都基辅以北被摧毁。无论是他们，还是负责增援和解围的营级战术群，大多遭到伏击摧毁或陷入困境，既未配备也未受过进行持久战的训练。

在压垮乌克兰的尝试失败后，俄罗斯的军事和政治领导层在2022年期间成功适应了总体战略局势。俄罗斯的战略转变基于一种假设，即其可调用的军事和经济潜力大于其乌克兰对手，因此能够同时消耗乌克兰军队和平民。在此背景下，军事创新——即在武装部队中发展和运用新技术以实现军事效果——最初只发挥了次要作用。

相反，条令适应性和增加部署经过实战检验的系统，构成了俄罗斯军事战略方法的基石。由于看不到速胜前景，俄罗斯领导层使国家为长期战争做好了准备。2022年12月，一项全面的军事改革——即所谓的“绍伊古改革”获得通过，其设想将俄罗斯武装力量大幅扩充至150万人。仅2023年上半年，在丰厚经济激励措施的推动下，在乌作战的军事人员数量就从36万增至41万，从而免除了进行第二轮部分动员的需要。此前的2009年军事改革——即所谓的“谢尔久科夫改革”——旨在将武装力量的重心转向国际和国内危机处理，缩减规模并提高快速部署能力，但并不适应高强度作战。如今，这些理念大多被摒弃。取而代之的是采纳了一种新的条令，它更少依赖营级战术群的战术灵活性和自持力，而是着眼于在作战层面利用俄军在战斗力方面相对于乌克兰军队的数量和部分质量优势。俄军大部回归了传统的苏联团、师和集团军群结构。

自此以后，尽管付出了己方重大的人员和物资损失代价，俄罗斯的军事行动开始有针对性地打击乌克兰部队集群，通过发挥俄方更高的火力发射速率，在过度延伸的前线以缓慢但稳定的步调作战，来摧毁它们。此外，俄罗斯在冬季月份加强了对乌克兰基础设施的持续攻击。这主要旨在摧毁乌克兰的能源供应，并利用远程空射或海基武器破坏人口稠密城市地区的关键民用设施，以打破乌克兰人的抵抗，并削弱对战争至关重要的工业。

为了维持其中期消耗乌克兰军队及其平民、经济和基础设施的战略方针，俄罗斯在军事和经济层面做出了多项战略调整。在初期压垮战略被证明失败后不久，俄罗斯国防工业便基本转为战时生产，以弥补前线物资损失并装备新动员的部队。除了生产新的主战装备外，俄罗斯武装部队迄今主要依靠使用现有武器库存来弥补其大部分前线损失。其每年生产的约1500辆坦克和3000辆步兵战车中，约80%是经过重新启用和升级的苏联时期系统。此外，来自伊朗和朝鲜的直接武器弹药供应，有助于减轻俄罗斯自身的消耗战略所带来的后果。俄罗斯通过与哈萨克斯坦、亚美尼亚等第三方国家的合作，找到了规避部分西方制裁和禁运的途径，并且与印度和“全球南方”国家的贸易关系得到加强，部分原因是为了弥补西方能源原料市场的损失。俄罗斯成功地采用了最初给其部队造成重大损失的乌克兰有效创新。其中最显著的是大规模使用小型、相对廉价的无人机。事实上，俄罗斯不仅采用了这些技术，还大幅增加了国内产量，并成功地将大规模无人机运用整合到其自身的军事条令中。据俄罗斯消息来源称，到2024年底，俄罗斯生产的无人机数量将比2023年增加十倍。

俄罗斯的电子战能力，在战前可能被高估且在初期相对无效，但很快适应了乌克兰的创新并在数量上得到扩展。这显著降低了交付给乌克兰的西方精确弹药的有效性。此外，这些能力被用于反制无人机，并与保护平台的物理临时解决方案结合使用。后来，俄罗斯为大量可用的常规武器和炸弹加装了快速临时制作的、相对简单的控制装置，以增加其射程和穿透力。因此，俄罗斯作战飞机得以在乌克兰防空系统的射程外活动。总而言之，俄罗斯的方法依赖于条令上的适应以及对现有能力和众多现有系统的技术改进。

乌克兰的适应与创新之道

另一方面，乌克兰武装部队的多功能之处，主要在于技术适应和创新。乌克兰人之所以能在2022年2月全面战争之初进行自卫，是因为在经历了2014年克里米亚被吞并和顿巴斯地区被部分占领的冲击后，他们为保卫国家做好了非常规防御的准备，并动员了社会的各个部分。这包括在人员和物资方面扩编了乌克兰正规军和预备役部队。此外，《国家抵抗基础法》的颁布推动了由现役军人和预备役人员组成的国土防御部队的建立，为潜在的俄罗斯占领下的平民抵抗运动建立了网络，并规定了平民接受军事训练的可能性。

然而，鉴于其数量上的劣势，乌克兰将其主要重点放在了一个其认为相对于俄罗斯具有优势的领域：技术。国防工业的加强和研究机构的资助，催生了与国防部门紧密相连的乌克兰创新中心。认识到相对于俄罗斯在常规力量上的劣势，乌克兰寻求为不对称战争生产、采购和储备武器系统。甚至在全面战争之前，乌克兰就开始不仅储备常规军事资产，还采购和生产军用无人机，并将其整合到部队中。无人机的单独使用并非创新概念，自2020年纳戈尔诺-卡拉巴赫冲突以来，它已成为现代常规战争的一部分。然而，这些系统的广泛和多样化运用，即其即使在最低战术层级得到实施，无疑是一种创新，并成为条令变革的驱动力。在此背景下，应强调的是，鉴于无人机作战带来的技术机遇，乌克兰高级军事人员，特别是乌克兰武装部队前总司令瓦列里·扎卢日内及其继任者亚历山大·瑟尔斯基，已呼吁在乌克兰武装部队中以"作战新设计"的形式进行条令调整。初步成果已开始在战场上显现。与在很大程度上回归苏联时代条令的俄罗斯武装部队不同，乌克兰在条令准备和适应方面的工作是技术驱动的、前所未有的，因而是创新性的。

除了传统的作战和侦察任务，乌克兰军队还使用无人机进行火炮目标识别与校射、战损评估、对被包围或难以到达的部队进行补给，以及利用无人机影像在信息领域达成效果。与人工智能无人机蜂群等颠覆性技术的结合，构成了乌克兰武装部队目前在该领域计划的最后一个创新循环。

除了无人机的创新性使用，还有许多其他例子说明了乌克兰武装部队的新方法。例如，由乌克兰国有的"量子-无线电定位"科研所开发的"矿"-U雷达系统，使得能够侦察黑海水面目标。这连同同样在乌克兰生产的"海王星"反舰导弹，给俄罗斯黑海舰队造成了相当大的损失，并辅以使用无人"自杀式"水面艇的成功作战行动。

经过现代化的"针"-1单兵便携式地空导弹及其在乌克兰部队中的整合，以及在乌克兰生产的"壁垒"-P和"海盗"反坦克导弹，使得能够打击俄罗斯战斗车辆和直升机，特别是在俄罗斯全面心动之初。用于侦察、C2和保障领域的软件，通常由乌克兰武装部队以外的志愿者开发，提高了有限的乌克兰常规手段的效能。最突出的例子之一是Kropyva应用程序，这是一款测绘软件，可整合无人机侦察结果、己方部队位置报告和接触报告。几乎能实时实现指挥控制以及战术和作战层级的火力与机动协调。乌克兰还能够快速将其系统与可商购的天基数据链整合，以确保全面的前线指挥和保障。与此创新精神紧密相关的另一个方面是：乌克兰目前正在摆脱受苏联影响的集中式指挥结构，给予战术军事领导者和保障部队更多的行动自由，甚至整合了（部分）自动化的数字指挥控制信息系统。例如，结合对俄罗斯可能攻击场景的同时开发进行的现代战略和作战兵棋推演，目前用于提高乌克兰总参谋部成员的决策技能。尽管如此，乌克兰的武装力量及其民众仍面临其对手的消耗战，使得俄罗斯得以保持战略主动权。为了摆脱这种不利动态，乌克兰也采取了走向条令适应的措施。然而，西方支持国迄今提供的武器弹药以及国内动员行动的成果，尚不足以使乌克兰消耗俄罗斯部队并将其损失增加到不可接受的水平。乌克兰试图通过以空间为导向、高度机动的突袭性（反）攻来实施其自身的压垮战略，在战术和作战层面确实在2022年秋季的哈尔科夫和赫尔松，以及2024年夏季的库尔斯克取得了一些成功。但并未能大幅给俄罗斯造成战略困境。

此外，乌克兰自下而上的创新方法，缺乏在所有部署的旅中广泛运用以及规模化工作。军事上对使用民用技术或其融入军事结构的限制，仍然是广泛实施创新技术的障碍。因此，在战争初期，经常有个别旅在私人捐助者的支持下独立采购民用技术，特别是无人机。总体而言，乌克兰的技术创新和部分条令创新，甚至在行动前就已启动，并随着战争持续而进一步加强，迄今为止使得该国能够以不对称方式在一些层面上对抗俄罗斯的（相对）规模数量优势。

成为VIP会员查看完整内容

博士论文 · 地理空间数据 · 生成式人工智能 · 时空建模 ·

今天 13:53

生成模型是学习高维数据中时空结构的强大工具。然而，现实世界中的许多时空数据集融合了多种模态，并在不同的时空尺度上演化，这对现有生成架构提出了挑战。本论文通过一个三重视角——即解析、预测与沟通高维时空输出——来研究时空生成建模，并以跨越广阔空间、时间和模态范围的地理空间数据作为测试平台。

首先，我提出了TEOChat，这是首个能够通过自然语言指令对地球观测序列进行空间和时间解析的大型多模态助手。我展示了，一个在自然图像和视频上预训练的视觉语言模型可以被重塑为一个强大的通用模型，以胜任时空解析任务。其次，我引入了时空金字塔流，这是一系列用于跨时间尺度高效进行气候预测的流匹配方法。时空金字塔流将生成轨迹分割为一个时空金字塔，其中每个阶段都在特定的时间尺度上运行，同时提高样本的空间分辨率，从而实现在任何时间层级上直接、并行的采样，并支持实时、准确的多尺度气候模拟。最后，我介绍了SAI模拟器，这是一个交互式平台，它能够以易于理解的形式，为研究人员、政策制定者和公众沟通复杂的时空气候输出（例如由生成模拟器产生的输出）。

这些成果共同展示了生成式人工智能如何能够解析、预测与沟通复杂的时空现象，从而实现对多模态、多尺度地理空间数据更有效的建模与交互。

成为VIP会员查看完整内容

智能体 · 记忆 ·

今天 13:51

AI智能体时代中的记忆：形式、功能与动态综述

记忆已成为并将继续成为基于基础模型的智能体的核心能力。它支撑着长程推理、持续适应以及与复杂环境的有效交互。随着智能体记忆研究的快速扩张并吸引空前关注，该领域也日益呈现碎片化。当前统称为"智能体记忆"的研究工作，在动机、实现、假设和评估方案上往往存在巨大差异，而定义松散的记忆术语的激增进一步模糊了概念上的清晰度。诸如长/短期记忆之类的传统分类法已被证明不足以捕捉当代智能体记忆系统的多样性和动态性。本综述旨在提供当前智能体记忆研究最新且全面的图景。我们首先清晰地界定智能体记忆的范围，并将其与大型语言模型记忆、检索增强生成和上下文工程等相关概念区分开来。然后，我们通过形式、功能和动态三个统一的视角来审视智能体记忆。 * 从形式视角，我们识别了智能体记忆的三种主要实现方式，即标记级记忆、参数化记忆和潜在记忆。 * 从功能视角，我们超越了粗略的时间分类，提出了一个更细粒度的分类法，区分了事实性记忆、经验性记忆和工作记忆。 * 从动态视角，我们分析了在智能体与环境交互的过程中，记忆如何随时间被形成、演化和检索。

为支持实证研究和实际开发，我们汇编了一份关于代表性基准测试和开源记忆框架的全面总结。在整合梳理之外，我们阐明了对于新兴研究前沿的前瞻性视角，包括面向自动化的记忆设计、强化学习与记忆系统的深度融合、多模态记忆、多智能体系统的共享记忆以及可信度问题。我们希望本综述不仅能作为现有工作的参考，更能作为一个概念基础，促使人们将记忆重新思考为设计未来智能体智能时的一等原语。

1 引言

过去两年，我们看到性能日益强大的大语言模型（LLM）已势不可挡地进化为强大的AI智能体（Matarazzo and Torlone, 2025; Minaee et al., 2025; Luo et al., 2025）。这些基于基础模型的智能体在多个领域——如深度研究（Xu and Peng, 2025; Zhang et al., 2025o）、软件工程（Wang et al., 2024i）和科学发现（Wei et al., 2025c）——取得了显著进展，持续推动着通往通用人工智能（AGI）的进程（Fang et al., 2025a; Durante et al., 2024）。尽管早期的"智能体"概念高度异构，但学界已逐渐达成共识：除了纯粹的大语言模型骨干外，一个智能体通常还需具备推理、规划、感知、记忆和使用工具等能力。其中一些能力，如推理和工具使用，已通过强化学习在很大程度上内化于模型参数之中（Wang et al., 2025l; Qu et al., 2025b），而另一些则仍然高度依赖于外部的智能体框架。这些组件共同作用，将大语言模型从静态的条件生成器转变为可学习的策略，使其能够与多样的外部环境交互并随时间自适应地演化（Zhang et al., 2025f）。在这些智能体的核心能力中，记忆尤为关键，它明确地促成了从静态大语言模型（其参数无法快速更新）到自适应智能体的转变，使其能够通过环境交互持续适应（Zhang et al., 2025r; Wu et al., 2025g）。从应用角度看，许多领域都要求智能体具备主动的记忆管理能力，而非短暂、易忘的行为：个性化聊天机器人（Chhikara et al., 2025; Li et al., 2025b）、推荐系统（Liu et al., 2025b）、社会模拟（Park et al., 2023; Yang et al., 2025）以及金融调查（Zhang et al., 2024）都依赖于智能体处理、存储和管理历史信息的能力。从发展角度看，AGI研究的一个核心目标是赋予智能体通过环境交互实现持续演化的能力（Hendrycks et al., 2025），而这根本上立足于智能体的记忆能力。 智能体记忆需要新的分类法 鉴于智能体记忆系统日益增长的重要性和学界关注，为当代智能体记忆研究提供一个更新的视角既恰逢其时，也十分必要。提出新分类法和综述的动机有两点：❶ 现有分类法的局限：尽管近期已有几篇综述对智能体记忆提供了宝贵且全面的概述（Zhang et al., 2025r; Wu et al., 2025g），但其分类体系是在一系列方法快速进展之前建立的，未能完全反映当前研究图景的广度和复杂性。例如，2025年出现的新方向，如从过往经验中提炼可复用工具的记忆框架（Qiu et al., 2025a,c; Zhao et al., 2025c），或基于记忆增强的测试时缩放方法（Zhang et al., 2025g; Suzgun et al., 2025），在早期的分类方案中尚未得到充分体现。❷ 概念碎片化：随着记忆相关研究的爆炸式增长，"记忆"这一概念本身正变得日益宽泛和碎片化。研究者们常常发现，标榜研究"智能体记忆"的论文在实现方式、目标和基本假设上差异巨大。各类术语（陈述性、情景性、语义性、参数化记忆等）的扩散进一步模糊了概念的清晰度，这凸显了建立一个能够统一这些新兴概念的、连贯的分类法的迫切需求。因此，本文旨在建立一个系统性的框架，以调和现有定义、衔接新兴趋势，并阐明智能体系统中记忆的基础原理。具体而言，本综述旨在回答以下关键问题： 关键问题

智能体记忆如何定义？它与大语言模型记忆、检索增强生成（RAG）和上下文工程等相关概念有何关联？ 1. 形式：智能体记忆可以采取哪些架构或表示形式？ 1. 功能：为何需要智能体记忆？它服务于哪些角色或目的？ 1. 动态性：智能体记忆如何随时间操作、适应和演化？ 1. 推动智能体记忆研究的前沿方向有哪些？

为解答问题❶，我们首先在第2节为基于大语言的智能体及智能体记忆系统提供形式化定义，并详细比较智能体记忆与大语言模型记忆、检索增强生成（RAG）和上下文工程等相关概念的异同。遵循"形式-功能-动态"三角框架，我们对智能体记忆进行了结构化概述。问题❷探讨记忆的架构形式，我们在第3节讨论并重点介绍了三种主流实现方式：标记级记忆、参数化记忆和潜在记忆。问题❸关注记忆的功能角色，在第4节中，我们区分了三种功能类型：事实性记忆（记录智能体与用户及环境交互中获得的知识）、经验性记忆（通过执行任务逐步增强智能体解决问题的能力）和工作记忆（在单个任务实例中管理工作区信息）。问题❹聚焦于智能体记忆的生命周期与运作动态，我们将按记忆形成、检索和演化的顺序进行阐述。在通过"形式-功能-动态"视角梳理现有研究后，我们进一步提出了对智能体记忆研究的观点与见解。为促进知识共享与未来发展，我们首先在第6节总结了关键基准测试和框架资源。在此基础上，我们通过第7节探讨数个新兴但尚未充分发展的研究前沿来解答问题❺，这些方向包括面向自动化的记忆设计、强化学习（RL）的融合、多模态记忆、多智能体系统的共享记忆以及可信度问题。 本综述的贡献 总结如下：(1) 我们从一个"形式-功能-动态"的视角，提出了一个最新且多维度的智能体记忆分类法，为理解该领域的当前发展提供了一个结构化的视角。(2) 我们深入探讨了不同记忆形式与功能目的的适用性及相互作用，为如何将各类记忆类型有效地与不同的智能体目标对齐提供了见解。(3) 我们探讨了智能体记忆中新兴且有前景的研究方向，从而勾勒出未来的发展机遇与推进路径。(4) 我们汇编了包括基准测试和开源框架在内的综合资源集，以支持研究人员和从业者进一步探索智能体记忆系统。 综述结构 本综述余下部分结构如下。第2节形式化定义了基于大语言的智能体与智能体记忆系统，并厘清了它们与相关概念的关系。第3、4、5节分别审视了智能体记忆的形式、功能和动态性。第6节总结了代表性的基准测试和框架资源。第7节讨论了新兴的研究前沿和未来方向。最后，我们在第8节总结关键见解，结束本综述。

成为VIP会员查看完整内容

多模态大语言模型 ·

多模态大语言模型下游调优中“保持自我”的重要性

摘要——多模态大语言模型（Multimodal Large Language Models，MLLMs）通过融合视觉与语言推理能力，能够应对图像描述、视觉问答等复杂任务。尽管 MLLMs 展现出卓越的通用性，但在特定应用场景中的性能仍然受限。针对下游任务对 MLLMs 进行调优主要面临两大关键挑战：任务专家化（Task-Expert Specialization），即预训练数据分布与目标任务数据分布之间的差异限制了目标性能的提升；以及开放世界稳定性（Open-World Stabilization），即灾难性遗忘会导致模型丧失原有的通用知识。本文系统性地综述了近年来 MLLM 下游调优方法的最新进展，并将其归纳为三种范式：（I）选择性调优（Selective Tuning）、（II）加性调优（Additive Tuning）以及（III）重参数化调优（Reparameterization Tuning）。此外，我们在多种主流 MLLM 架构和多样化下游任务上对这些调优策略进行了系统基准评测，以建立标准化的评估分析框架和系统性的调优原则。最后，我们总结了该领域中仍然存在的若干开放挑战，并提出了未来的研究方向。为促进这一快速发展领域的持续进步，我们还提供了一个持续更新的公共资源库，用于跟踪相关研究进展：https://github.com/WenkeHuang/Awesome-MLLM-Tuning。 **关键词——**多模态大语言模型，下游调优，专用能力提升，泛化稳定性

1 引言

大型语言模型（Large Language Models，LLMs）的成功显著重塑了人工智能领域的发展格局，在自然语言理解与生成方面展现出前所未有的能力 [1]–[5]。其卓越的通用性与可扩展性在多个领域树立了新的性能基准，从对话式智能体到复杂问题求解任务均取得了突破性进展。为进一步拓展 LLM 的应用边界，研究者们投入了大量努力，将 LLM 扩展为多模态大语言模型（Multimodal Large Language Models，MLLMs）。这类模型在处理视觉输入并生成连贯且上下文相关的文本描述方面表现出色 [6]–[10]。这种跨模态融合显著拓宽了人工智能的能力边界，使模型具备多模态理解与交互能力。近年来，MLLM 已迅速从图像描述、视觉问答等基础任务，发展为能够执行复杂推理与创造性生成的高级系统。鉴于 MLLM 通常在大规模、多类型的多模态指令跟随数据集上进行优化 [11]–[15]，其在开放世界场景下对相关任务展现出强大的泛化能力。MLLM 的快速发展推动了其在众多实际应用中的落地，包括自动驾驶 [16]、[17]、医疗诊断 [18]、[19] 以及遥感分析 [20] 等。尽管具备上述优势，MLLM 在某些专业领域或私有数据集上的表现仍然不尽如人意 [21]–[25]。因此，针对下游任务对 MLLM 进行调优（tuning）已成为提升性能的有效途径。在调优阶段，MLLM 能够进一步增强特定任务性能，或使模型行为更好地对齐人类期望 [26]、[27]。然而，尽管调优具有显著潜力，MLLM 在保持良好泛化能力方面仍面临严峻挑战。这主要源于下游数据集往往与预训练阶段所学习到的通用数据分布存在显著差异。模型在适应目标分布的过程中，可能会丧失在预训练阶段获得的通用能力。此外，新知识的学习对已有通用知识产生的负面影响——即灾难性遗忘（catastrophic forgetting）——也是下游适配中一个众所周知的问题 [22]、[23]、[28]–[30]。为明确本综述的研究动机，我们形式化地总结了 MLLM 下游调优中的两个核心挑战： ♠ 任务专家化（Task-Expert Specialization）：当下游数据集呈现出与预训练阶段显著异构的分布特性时，预训练 MLLM 在目标任务上的性能往往受到限制，因此需要通过下游调优使模型演化为特定领域的专家模型。 ♣ 开放世界稳定性（Open-World Stabilization）：在针对下游分布进行优化后，MLLM 可能遭受灾难性遗忘，从而丢失在预训练阶段获得的通用知识，最终损害其整体泛化能力。针对上述挑战，近年来研究者提出并发展了多种先进的调优策略，整体可归纳为以下三大类：（I）选择性调优（Selective Tuning，§3.1），通过选择与下游任务高度相关的参数子集进行更新；（II）加性调优（Additive Tuning，§3.2），在输入空间或模型内部结构中引入额外的可训练模块；（III）重参数化调优（Reparameterization Tuning，§3.3），利用低秩矩阵分解等技术对原始参数权重进行重构。尽管现有调优方法已被广泛研究，多模态大语言模型领域仍缺乏统一的评估分析框架，用以系统性地衡量不同调优策略在 MLLM 场景下的有效性与独特性。此外，缺乏系统化的调优原则也导致实现流程存在不确定性，进而引发冗余的超参数实验和低效的资源配置。因此，构建全面的评估体系与严格的调优指导原则，对于加速 MLLM 在时间和人力成本受限的真实应用场景（如医学影像分析和遥感任务）中的部署至关重要。本文在图 1 中给出了整体研究概览。

1.1 相关综述工作

随着多模态大语言模型（MLLM）近年来迅速成为研究热点，大量综述性论文相继出现。现有综述大致可分为两类：第一类侧重于 MLLM 的整体发展脉络，强调其在多个应用领域中的潜力，但由于聚焦于概念框架与宏观指导，往往忽视了对具体下游挑战与问题的深入探讨；第二类工作对现有调优方法提供了宽泛的总结，但缺乏系统性的概念框架和针对具体调优技术的深入评估。尽管少数研究 [31]、[32] 讨论了模型稳定性问题，但其主要关注持续学习（continual learning）范式，即研究神经网络如何在持续学习新知识的同时保持已有知识 [33]–[38]，难以直接适配到 MLLM 场景中。MLLM 不仅具有独特的模型结构，还涉及多样化的调优选择，使得传统持续学习方法难以直接迁移。总体而言，随着该领域的快速发展，**专家化（Specialization）与稳定性（Stabilization）**已成为下游调优多模态大语言模型的两个关键维度：前者确保模型在目标分布上的性能，后者保障模型在广泛通用任务上的适应能力。尽管近年来涌现出大量新工作，现有综述多从碎片化视角出发，缺乏统一分析。相比之下，我们认为这两个方面是相互耦合、共同决定 MLLM 实际部署效果的核心因素。本文是首个同时系统研究下游专家化与上游稳定性，并在多视角实验分析中进行统一基准评测的综述工作。

1.2 论文结构

本文结构如图 1 所示，具体安排如下： §1 介绍多模态大语言模型（MLLM）的发展背景，并概述其在真实场景下调优所面临的两大技术挑战：任务专家化与开放世界稳定性。 §2 系统介绍 MLLM 的建模形式及其调优流程，并进一步指出专家化提升与稳定性遗忘问题。 §3 给出调优方法的分类体系：§3.1 讨论选择性调优方法，通过更新部分已有参数以适应下游分布；§3.2 介绍加性调优方法，通过引入额外参数模块实现领域适配；§3.3 探讨重参数化调优方法，如 LoRA 等模块对参数空间的重构。 §4 进行 MLLM 调优的系统性基准分析，其中 §4.1 描述实验设置、数据集与评估指标，§4.2 比较不同调优方法在多种下游数据集上的表现，§4.3 总结调优原则并分析其内在机理。 §5 讨论开放挑战与潜在研究方向，§5.1 展望未来工作，§5.2 对全文进行总结，强调 MLLM 调优在实际应用中的重要性。

1.3 主要贡献

为弥补现有研究空白，本文对 MLLM 调优过程中专家化与稳定性行为的产生机制进行了系统而及时的综述，主要贡献包括： * 全面综述：深入分析 MLLM 调优过程中专家化与稳定性问题，提供首个系统性、最新进展导向的多模态大语言模型调优综述，涵盖该领域数百篇相关研究。 * 深入分析：选取发表于顶级期刊与会议的代表性调优方法，对现有 MLLM 调优技术进行系统分类，并深入剖析各类方法的优势与局限。 * 系统基准评测：在多种下游场景下对不同调优策略进行全面基准实验，结合专家化与稳定性评估指标，为研究者选择合适基线方法提供实践指导。 * 前瞻性展望：讨论未来潜在研究方向，推动社区重新思考并改进多模态大语言模型在实际应用中的调优设计，促进该领域的持续发展。

成为VIP会员查看完整内容

AI与军事 · 俄乌战争 · 无人系统 ·

《俄乌战争中的无人系统：新的战争方式与新兴趋势——来自前线的印象》报告

俄乌战争已在大多数战场场景中引入了无人机的大规模使用。从班排级使用的侦察无人机、打击敌后数百公里战略目标的神风无人机、能够摧毁现代海军舰艇的海上无人机，到用于引导炮火打击的监视无人机——乌克兰已成为各种技术进步和新战略思想的试验场。尽管许多专家、爱好者和士兵认为无人机是改变游戏规则的武器，但包括乌克兰著名的军事情报总局局长基里洛·布达诺夫在内的其他人，并不相信无人机具有决定性作用。除了探讨无人机能否成为战场上的决定性武器这一问题，本文还讨论了与这类武器相关的局限性，这些局限性取决于部署场景、作战环境、对手的技术水平、生产能力等因素。本文也考量了这样一种假设，即无人机将“仅仅”作为其他武器系统（从反坦克导弹到地对地导弹）的补充，并作为地面部队、侦察组和其他特种单位的通用技术支援工具。本文首先分析无人机在乌克兰使用的起源，然后描述无人机技术的相关发展，并审视无人机使用的现状以及乌克兰无人机生产的政治、经济和实践方面。本文不涉及俄罗斯无人机作战的任何方面。

海上无人作战：海上拒止与完全制海权

乌克兰使用无人武器的其中一个最引人注目的例子，是其针对俄罗斯黑海舰队的海上无人机作战。然而，使用海上无人载具攻击较大海军舰艇的想法并不新鲜，也非乌克兰人所首创。20世纪30年代和40年代，美国就已着手开发能够攻击敌方舰船的空射无人系统。20世纪80年代，泰米尔猛虎组织曾尝试使用海上无人机攻击斯里兰卡海军舰艇。2017年，胡塞武装用一艘海上神风无人机击中了沙特护卫舰“麦地那”号，但未击沉该舰。然而，尽管乌克兰人并未开发出全新的东西，但他们显著改进了这一工具。乌克兰的成功可归因于三个因素：a) 通信系统好得多；b) 无人机的大规模生产；c) 创造性地使用无人机，包括采用狼群战术和与空中无人机的协同攻击。

乌克兰发展海军无人机舰队的道路并非没有挑战。在整个20世纪90年代和21世纪初，乌克兰曾致力于建立一支传统的海军舰艇舰队。这些抱负的显著例子包括：2011年宣布、原定2016年交付但最终未能完工的“弗拉基米尔大帝”号护卫舰；由尼古拉耶夫造船厂设计、在基辅生产至2020年的7艘“斑蝰蛇”级炮艇，它们主要以2018年在刻赤海峡与俄罗斯舰艇的不成功交战而闻名；以及在土耳其造船厂建造的两艘“岛”级护卫舰，本应为乌克兰提供一些额外的火力，但迄今未能取得任何成功。

与乌克兰的雄心有些相悖的是，一支庞大的海军无人机舰队，对于有效将俄罗斯黑海舰队逼退至黑海东部港口（甚至可能至里海）起到了关键作用。2022年初，乌克兰两个相互竞争的情报机构分别启动了海军无人机项目。首先，乌克兰国家安全局开发了一种绰号为“海宝贝”的无人水面艇，这是一种可携带多达800公斤炸药战斗部的遥控快艇。另一个竞争者——乌克兰国防部情报总局，则以他们设计的“马古拉”无人机作为回应，其设计非常相似，能够携带320公斤炸药，航程可达450海里。两种无人机巡航速度可达20节，最高速度为45节。2022年，乌克兰无人机已开始攻击俄罗斯海军舰艇、油轮，以及刻赤大桥和新罗西斯克石油码头等基础设施。2023年，乌克兰加大了攻击强度，甚至击伤了俄罗斯最现代化的信号情报搜集船“伊万·胡尔斯”号和一艘“卡拉库特”级导弹护卫艇。后者于2023年7月才加入俄罗斯黑海舰队服役。

直到2024年初俄罗斯将其能发射“口径”巡航导弹的舰艇撤往里海之前，乌克兰无人机参与了多次有视频记录确认的对俄罗斯舰艇的打击。视频证实了乌克兰无人机所采用成功战术的关键组成部分。成功击沉一艘舰船需要多架无人机进行多次命中。显然，考虑到其相对较低的速度和有限的载药量，无人机撞击造成的破坏无法与高速、大战斗部导弹造成的损害相提并论。而且，与鱼雷不同，无人机是在水线以上而非以下攻击舰船。因此，需要一群无人机进行协同攻击。

成功的无人机攻击还需要高度可靠的快速通信系统，最好是卫星通信。据报道，2022年乌克兰对塞瓦斯托波尔港的首次攻击在埃隆·马斯克意外拒绝乌克兰使用其“星链”通信系统后失败了。数架无人机失去连接并被冲上岸，这给了俄罗斯时间为乌克兰后续攻击做准备。

乌克兰海军无人机取得成功的最后一个原因，与其低成本以及可以利用现成部件生产而不必担心短缺有关。大多数无人机使用的是商用摩托艇的发动机和其他部件。这些无人机使用的引信是苏联时期高爆航空炸弹的标准触发引信。加上每架25万至35万美元的单价，使得无人机生产具有很强的抗打压韧性。由于零部件全球市场有售、生产成本低廉，且该产品的技术水平使其能够在任何具备快艇制造能力的车间组装，因此，无论是通过经济手段还是针对性打击生产设施，都无法停止海军无人机的生产。

对俄罗斯而言，对抗海军无人机唯一有效的方法似乎是让直升机不断在海面巡逻，用机炮摧毁无人机。其小巧的尺寸和低矮的外形使其对雷达隐形，使得反无人机作战几乎变成了一场近战。乌克兰部队通过其反制俄罗斯防御策略的战术，对俄罗斯防空系统构成挑战并危及俄罗斯直升机。据报道，2024年6月，一架正在执行反无人机任务的俄罗斯卡莫夫直升机被己方防空火力误击摧毁。

然而，无人机作战既有优势，也有弱点。尽管是摧毁大型舰艇的廉价有效手段，从而能够阻止敌方海军使用被围水域，但无人机无法完全控制海洋。它们的航程也有限，并且高度依赖于为其提供目标坐标的情报数据。这或许可以解释为何针对俄罗斯海军的攻击大多发生在港口内或港口附近——海军无人机还无法在公海上对舰船进行自由猎杀。期望无人机能在公海常见的风暴和大浪等恶劣条件下运行也还不现实。尽管如此，乌克兰目前正在开发运用海军无人机的新方法。例如，为海军无人机配备防空和对陆多管火箭系统导弹。这可以将海军无人机转变为移动火炮或防空平台，利用海面进行机动，特别是在沿海区域和相对平静的水域。

无人机作战的最新发展证明了海军无人机能力的这种固有局限性。虽然针对陆战无人机的新功能和运用方式不断被开发出来，但海军无人机几乎已从新闻中消失。既然俄罗斯已将其大部分舰队从黑海转移至亚速海，甚至里海，乌克兰无人机便失去了猎杀的目标。这看似矛盾：自从乌克兰将俄罗斯舰队有效逼出黑海后，乌克兰再无海军胜绩，也未发动后续的陆地作战。然而，这有一个非常合乎逻辑的解释：乌克兰海军无人机无法突破部署在刻赤大桥前的俄罗斯防御，那里守卫着进入亚速海的入口，因此无人机无法攻击刻赤大桥以北的俄罗斯舰船。乌克兰也无法在克里米亚或其他地方实施两栖登陆作战，因为它缺乏如巡洋舰、护卫舰和驱逐舰等传统舰艇来压制俄罗斯地面部队并提供防空，当然也缺乏实施登陆行动本身所需的登陆舰。克里米亚的命运将由地面作战决定，而不会涉及海军无人机。

同样是由于缺乏传统舰艇，乌克兰也一直无法通过其他手段扩展其对黑海的控制。仅靠无人机，无法实现这种控制。当然，这并不意味着乌克兰部署海军无人机毫无影响——仅摧毁能够携带“口径”巡航导弹的俄罗斯海军舰艇一项，就拯救了无数乌克兰人的生命。乌克兰敖德萨州和尼古拉耶夫州的海岸也得以免受俄罗斯登陆行动的威胁。但与陆战中使用的无人机相比，海军无人机在可用性方面表现出非常明确的局限：它们仅用于在合理距离内、平静水域且有足够侦察支援的情况下，阻止敌方控制有限的海域。乌克兰海军无人机在黑海的惊人成功，部分可归因于该作战区域的独特性。虽然乌克兰的无人机供应不受限制，但俄罗斯无法简单地从其他舰队调集更多海军舰艇到黑海，因为土耳其控制并限制着通过海峡进入黑海的通道。这使得黑海成为一个非常特殊的战场，其特点是水域封闭、距海岸距离短、缺乏大浪以及其他有利于无人机的因素。

成为VIP会员查看完整内容

AI与军事 · 无人潜航器 (UUV) ·

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

水下无声革命

美海军正通过隐身无人潜航器技术的空前进步，从根本上改变水下作战形态，将自主无人水下航行器定位为21世纪海上安全架构的关键组成部分。随着全球海军竞争在对抗性水域日益加剧，这些复杂的机器人平台正成为改变游戏规则的资产，其能在敌对环境中不被察觉地运行，收集情报、实施侦察，并可能在不危及人员生命的情况下应对敌方威胁。

美海军的技术发展路线图现在将无人系统列为优先事项，将其视为能够扩展作战范围、维持持久监视并在传统载人舰艇面临风险不断升级的对抗领域执行任务的力量倍增器。近期的部署和测试项目表明，隐身无人潜航器不仅仅是对现有能力的渐进式改进，更是海军部队在水下投送力量、维持态势感知和威慑对手方式的范式转变。

战略要务：隐身无人潜航器为何在当下至关重要

当代海上安全挑战需要超越传统海军平台的创新解决方案。传统潜艇虽然强大，但需要大量船员、广泛的后勤支持和巨额资金投入。隐身无人潜航器系统以较低的作战成本提供了互补能力，能够同时在广阔海域展开分布式海上行动。

驱动无人水下航行器发展的战略考量集中在几个趋同的因素上。首先，包括俄罗斯等在内的近邻竞争对手已大幅扩充潜艇舰队和反介入/区域拒止能力，使得美海军在关键区域的行动复杂化。其次，包括通信电缆、能源管道和传感器网络在内的水下基础设施面临日益增加的破坏或监视风险。第三，人工智能、电池系统和自主导航等新兴技术已足够成熟，能够实现持续数周甚至数月的真正独立的水下作业。

根据五角大楼最近的评估，无人水下系统到2045年将构成未来海军平台的约40%，这反映了机构层面对自主能力在大国竞争中提供非对称优势的认识。美海军的水下作战条令日益强调分布式、网络化的力量，而非集中的打击群，无人水下航行器在对抗性战场空间中充当着持久的传感器、通信节点和潜在的武器投送平台。

实现作战可行性的技术突破

近期的技术进步已将隐身无人潜航器的概念从实验原型转变为可部署的作战系统。电池技术的改进，特别是锂离子和燃料电池系统，现在使无人水下航行器能够连续运行更长时间，而无需浮出水面或在任务中途充电。先进的推进系统最大限度地降低了声学特征，使这些平台即使在被声学监视的水域也能不被察觉地运行。

人工智能和机器学习算法或许是自主水下作战最具变革性的赋能因素。现代无人水下航行器采用复杂的决策框架，使其能够在无需人类持续监督的情况下，在复杂水下地形中导航、避开障碍物、识别潜在威胁，并根据环境条件调整任务参数。这些系统集成了传感器融合能力，能够整合声学、磁学和光学数据流，即使在能见度降低的条件下也能构建全面的环境图像。

导航在水下领域仍然是根本性挑战，因为全球卫星导航系统信号无法穿透。当代无人水下航行器通过集成惯性导航系统、地形匹配算法和声学定位网络来解决这一限制。一些先进平台集成了量子传感技术，可探测微小的重力变化以实现无需外部参考的精确导航。通信能力也类似地得到发展，系统现在采用低截获概率声学调制解调器，并在许可环境中运行时偶尔浮出水面进行卫星数据突发传输。

美国海军技术开发界继续大力投资扩展作战包线。当前的研究重点包括使多个无人水下航行器能够自主协作的集群协调算法、利用海洋热梯度的增强型能量收集系统，以及允许快速重新配置以执行从反水雷到反潜作战等不同任务集的模块化有效载荷。

重塑海军能力的作战项目

美海军运行着数个不同的无人水下航行器开发项目，以满足不同规模和能力谱系下的多样化作战需求。以“逆戟鲸”项目为代表的超大型无人水下航行器，是目前正在开发的最大、能力最强的自主水下平台。这些潜艇尺寸的航行器长约51英尺，排水量超过50吨，能够独立运行数月，同时携带包括传感器、水雷或潜在武器系统在内的可观有效载荷。

波音公司是“逆戟鲸”超大型无人水下航行器项目的主承包商，美海军在成功完成原型测试后订购了五套生产型。这些平台利用了最初为“回声航行者”验证机开发的技术，该验证机完成了超过6500英里的长航时自主任务。“逆戟鲸”设计为从岸上设施而非母艇潜艇部署，在保持战略到达能力的同时降低了作战复杂性。其模块化有效载荷舱可容纳多种任务模块，从而能够根据作战需求的演变，快速重新配置以支持情报收集、水雷战、电子战或打击任务。

大型无人水下航行器属于中等能力范围，通常长20-30英尺，重数吨。“蛇头”项目代表了海军在大型无人水下航行器方面的主要工作，旨在开发与潜艇鱼雷发射管兼容的平台。诺斯罗普·格鲁曼公司和洛克希德·马丁公司已获得原型开发合同，系统预计在未来几年内达到初始作战能力。这些航行器为“弗吉尼亚”级潜艇等平台提供了可部署的自主资产，用于前沿侦察、通信中继或有效载荷投送，而无需母船暴露自身于被探测风险之下。

中型和小型无人水下航行器用于满足战术需求，包括反水雷、港口安全和近距离监视。由通用动力任务系统公司开发的“刀鱼”水面反水雷无人水下航行器，采用先进声纳系统探测和分类濒海环境中的掩埋水雷——这项任务传统上需要潜水员或专用舰艇在危险条件下执行。同样，“狮子鱼”小型无人水下航行器为远征部队提供了可由小艇、海滩或前沿作战地点部署的单兵便携式水下侦察能力。

竞争全谱系中的海上安全应用

隐身无人潜航器平台在竞争、危机和冲突的整个谱系中增强了海上安全。在和平时期的竞争中，持久的无人水下航行器监视能够持续监控对手的潜艇基地、航运模式和水下基础设施，而不会产生载人舰艇在敏感区域行动所带来的外交复杂问题。这些系统可以在关键阻塞点附近游弋，跟踪潜艇过航和通信，而无需浮出水面或暴露其存在。

情报、监视与侦察任务是当前一代无人水下航行器的主要应用领域。先进的声学传感器阵列、合成孔径声纳系统和光学成像能力，使这些平台能够测绘海底地形、识别水下设施、监视海上交通并跟踪对手舰船，其分辨率以往需要依赖高风险的载人潜艇行动才能实现。长续航力所实现的持久存在意味着战略区域能得到持续观察，而非受限于潜艇部署周期的间歇性监视。

随着无人水下航行器能力的成熟，反潜战应用正在迅速扩展。自主传感器分布式网络可以在战略区域建立声学屏障，探测和跟踪对手潜艇，同时减轻传统反潜战平台的负担。未来的概念设想无人机蜂群协同搜索和跟踪潜艇接触，采用协同搜索模式和传感器融合，以保持接触，即使面对采用先进声学对抗措施的静音对手潜艇。

水雷战场景尤其清晰地展示了无人水下航行器的作战优势。自主系统可以系统地勘测疑似水域，通过先进的分类算法识别水雷，并或将其标记以备后续清除，或使用集成对抗系统直接消除威胁，从而避免使载人舰艇或潜水员冒险进入可能布设水雷的水域。“刀鱼”及类似平台将反水雷作战从高风险串行行动转变为分布式、持续性的清除行动。

基础设施保护是一个新兴的任务领域，水下无人机海军作战在此提供了独特能力。海底通信电缆承载着约99%的洲际数据流量，使其成为对手破坏或监视的战略目标。同样，海上能源基础设施、港口设施和海军基地也极易成为破坏或侦察的目标。自主无人水下航行器巡逻可以持续监视这些关键资产，检测可疑活动、未经授权的船只或潜在威胁，其效率远高于水面巡逻或定期的载人检查。

地缘政治背景：同级水下竞争

美海军对隐身无人潜航器技术投资的加速，发生在水下领域战略竞争日益加剧的背景下。美军认为潜在对手也在同步发展自身的无人水下航行器能力，尽管公开信息表明美国项目在自主性、续航力和传感器性能方面保持着技术优势。如俄罗斯的发展特别侧重于大型自主系统，包括“波塞冬”核动力鱼雷以及用于北极行动的各种研究平台。

北冰洋正成为水下竞争的新兴领域，因为气候变化减少了冰层覆盖，开辟了新的过境通道和资源获取机会。所有北极国家都在该地区扩展潜艇和无人水下航行器的行动，其中自主系统在季节性冰层下持续运行方面具有特殊优势。美国海军的北极战略明确将无人水下系统视为维持区域态势感知和作战介入的关键赋能因素。

其他海域推动海上安全自主系统的发展。尤其拥挤、声学复杂的浅水环境有利于能够在密集商业交通和复杂海底地形中隐蔽运行的持久性平台。无人水下航行器提供了在争议区域保持态势感知的选择，而不会产生与传统海军存在行动相关的政治复杂性或升级风险。

挑战与局限：为近期期望降温

尽管技术进步显著，但先进的无人水下航行器开发项目仍面临重大挑战，这些挑战限制了其当前的作战能力，并使将其整合到海军力量结构变得复杂。通信限制仍然是根本性的，因为水声信道仅能提供低带宽连接，不适合传输大量数据或实现响应式指挥控制。这一限制要求系统具备高水平的自主性，但如果无人水下航行器遇到需要人类判断的意外情况，也会产生风险。

自主系统的指挥控制框架引发了关于权限、责任和交战规则的复杂问题。虽然当前的无人水下航行器在人类监督下运行并遵循预设的任务参数，但未来的应用（包括武装型）将需要明确的条令指导，规定自主系统何时可以使用武力，以及在何种情况下必须保留人类授权。关于自主武器系统的国际人道法考量，为作战运用决策增加了额外的复杂性。

对手的反无人水下航行器能力正与友方的发展同步演进。潜在的威胁包括被动和主动声学探测系统、自主的猎杀型无人水下航行器、针对自主控制系统的网络攻击，以及在拒止区域对航行器的物理捕获。大多数无人水下航行器相对较低的速度限制了其被探测时的规避选项，而其高昂的单体成本使得损失可能非常重大。全面评估其脆弱性需要在测试期间进行逼真的威胁模拟——这项能力在当前的验证项目中仍然不足。

后勤和维护对持续作战提出了实际挑战。虽然无人水下航行器相比传统潜艇减少了人员需求，但它们仍然需要广泛的后勤支持基础设施用于任务规划、数据利用、维护和物流。电池系统需要定期更换，传感器需要校准和维修，船体完整性检查也必不可少。支持超大型无人水下航行器行动的岸上基础设施意味着重大的资本投入，特别是对于支持分布式海上作战概念的前沿部署地点。

美军将隐身无人潜航器融入海军架构与未来概念

美海军将隐身无人潜航器技术视为分布式海上作战概念不可或缺的组成部分，而非独立能力。近期战略文件中阐述的“分布式海上作战”框架强调在网络化的力量在广阔地理区域行动，以同时给对手制造多重困境，同时降低对集中打击的脆弱性。无人水下航行器在这一分布式架构中充当传感器、通信节点和潜在的武器投送平台。

与有人平台的整合仍然是美海军发展的优先事项。“弗吉尼亚”级潜艇和未来的“哥伦比亚”级弹道导弹潜艇配备了部署和回收大型无人水下航行器的设施，从而扩展了这些舰船的有效传感器范围并减少了其被探测的风险。水面作战舰艇同样正在获得发射和控制无人水下航行器的能力，用于反水雷、反潜战和远征任务。有效的有人-无人协同需要稳健的通信系统、直观的操作员界面以及常规功能的自动化，以避免因额外的协调负担而使舰员不堪重负。

蜂群概念代表了水下作战创新的一个特别有前景的前沿。多个自主载具协同行动，可以完成单个平台无法完成的任务，同时为应对个别载具故障或损失提供冗余。设想中的应用包括：协同搜索模式以快速覆盖大面积区域；多基地声纳配置以提高对静音目标的探测性能；以及饱和攻击以压倒对手的防御。实现这些概念需要在蜂群算法、载具间通信以及能够验证复杂涌现行为的测试方法方面取得进展。

模块化有效载荷和开放式架构使得在技术成熟和作战需求变化时能够快速演进能力。当前的计划强调适应性强的平台，可容纳多种传感器套件、通信系统以及可能的武器，而不是为每项任务开发专用无人水下航行器。这种方法降低了开发成本，加快了能力交付速度，并在战略形势演变时提供了作战灵活性。行业合作伙伴正在开发跨多种航行器级别的标准化接口和有效载荷模块，从而产生加速创新的生态系统效应。

人工智能和机器学习有望在未来几十年显著增强无人水下航行器的能力。当前系统采用相对简单的基于规则的自主性，但新兴的人工智能技术可以实现更复杂的行为。美国海军正在投资“人工智能可靠性”方法，以确保这些系统即使在面对超出其训练经验的新情况时，也能表现出可预测和可靠的行为。

美海军工业基础与国际伙伴关系

美国支持无人水下航行器开发的国防工业基础包括成熟的顶级承包商、专业的技术公司和学术研究机构。波音、通用动力、洛克希德·马丁和诺斯罗普·格鲁曼作为主要采购项目的主承包商，将专业供应商的子系统集成为完整的作战平台。这些主承包商利用其在海洋系统、自主技术和复杂项目管理方面的丰富经验，将需求转化为可部署的能力。

专业公司提供了实现无人水下航行器能力的关键技术。电池制造商开发提供更长续航力的先进能量存储系统。传感器公司提供声学阵列、光学系统和磁探测器。软件公司开发自主算法、任务规划工具和数据利用能力。导航系统供应商提供惯性测量单元、声学定位系统和新兴的量子传感器。这种生态系统方法将创新分布在众多公司之中，同时在主承包商层面保持集成专业知识。

国际组织关系将无人水下航行器的开发扩展到了国家性工作之外。澳大利亚、英国和美国之间的“澳英美三边安全伙伴关系”包括在水下自主系统方面的合作。这些国家正在联合开发技术、分享作战概念并协调需求以确保互操作性。通过北约框架也进行着类似的合作，成员国分享研究成果并协调能力开发，以避免重复工作，同时确保联盟部队能够有效协同作战。

包括日本、韩国和数个欧洲国家推动着其自身先进的无人水下航行器开发计划。日本在自主水下系统方面展现了先进水平，利用了其先进的商业水下技术领域。欧洲国家在特定技术领域，如静音技术、先进材料和新型推进概念方面提供了专业知识。

美海军正在推动培育非传统国防承包商和技术初创公司，它们为水下自主挑战提供了新颖的解决方案。小公司在追求高风险、高回报的技术方面通常展现出更大的灵活性，而这些技术是成熟公司所回避的。近期的采购改革工作使得与非常规公司的合同签订速度更快，加速了创新周期。几家风险投资公司专注于海洋技术投资，创造了支持初创公司度过开发阶段的金融机制，直到它们能够竞争传统的国防合同。

对海战的战略影响

隐身无人潜航器能力的扩散将从根本上改变支配水下战及更广泛海军作战的战略考量。传统潜艇战强调隐蔽、耐心以及对有限探测机会的谨慎管理。在对抗区域持久运行的自主系统，减少了对手潜艇的作战自由度，迫使它们保持更深、移动更慢或接受更高的探测风险——所有这些都限制了其效能。

有利于无人系统的成本交换比带来了特别的战略优势。一艘“弗吉尼亚”级潜艇的成本约为35亿美元，需要135名船员，而一艘“逆戟鲸”超大型无人水下航行器的成本大约在4000万到5000万美元之间，且完全自主运行。这种成本差异使得能够以单个传统平台的成本分布式部署多艘无人水下航行器，从而使对手的目标定位计算复杂化，并为应对损失提供了冗余。即使对手成功压制了个别无人水下航行器，整体任务仍能以最小的作战影响继续。

然而，技术扩散确保了竞争对手最终将部署可比较的能力，这可能导致水下作战环境对各方都相互恶化。如果多个国家在战略水域部署大量自主系统，由此产生的拥塞和相互监视可能会使各方的传统潜艇行动复杂化。这种动态最终可能有利于拥有更庞大潜艇舰队和更广泛岸基基础设施的国家。

向无人系统的转变也可能改变支配海军竞争的政治-军事动态。自主平台的损失与载人舰船的伤亡具有不同的政治后果，可能降低危机期间的升级门槛。相反，在无需承担船员风险的情况下保持持久存在的能力，可能使各国在争议区域采取更强硬的作战姿态，从而增加误判或意外升级的可能性。建立规范无人水下航行器行动的准则和建立信任措施，是战略稳定对话的一个重要议程项目。

未来展望：地平线上的下一代能力

未来，美海军技术路线图设想了能力远超当前平台的日益复杂的自主水下系统。包括紧凑型核动力源、先进燃料电池或诸如海水电池等非常规概念在内的能源突破性技术，可能实现近乎无限的续航力，从而将无人水下航行器从间歇性部署资产转变为永久的海洋哨兵。核动力无人水下航行器将匹敌传统潜艇的续航力，同时保持自主运行优势，尽管其单价会大幅提高并带来额外的安全考量。

包括增材制造在内的先进制造技术，可能实现无人水下航行器部件甚至整船的分布式生产和战地制造。这种能力将改变前沿部署部队的后勤，允许在不依赖漫长供应链的情况下快速更换受损或损失的系统。为增材制造优化的模块化设计可以进一步增强作战灵活性，使载具能够针对特定作战环境或任务要求进行定制。

受海洋生物启发的仿生技术为大幅提高效率和隐身性提供了潜力。模仿鱼类游动动作的推进系统可以将声学特征降低到低于当前机械螺旋桨或喷水推进系统的水平，同时提高能源效率。包含活性声学材料的类皮肤涂层可能实现自适应伪装，动态调整以匹配环境噪声特征。这些受生物启发的方法在很大程度上仍处于实验阶段，但如果成功从实验室过渡到作战系统，将代表潜在的变革性技术。

超越导航传感器的量子技术可能彻底改变水下通信和传感。量子通信系统有望实现安全、抗干扰的连通性，并且可能在经典电磁方法失效的水下环境运行。超越重力导航的量子传感技术可能使得在更远距离上探测潜艇的磁特征、声辐射甚至中微子辐射成为可能，从而从根本上改变当前有利于静音潜艇的探测几何格局。

海上安全自主系统与通用人工智能的融合，最终可能产生能够真正独立进行战略决策的水下平台。虽然当前的自主性仍然是狭隘且基于规则的，但未来的人工智能系统可能展现出可与人类操作员媲美的创造力、判断力和适应性。这些能力将实现当前技术无法完成的任务剖面，同时也引发了关于军事指挥结构、问责制以及自主系统在战争中的适当角色等深刻问题。

结论：为21世纪竞争变革海军力量

隐身无人潜航器技术所代表的远不止是渐进的能力提升——其标志着海军部队在海上领域运作、竞争和投送力量方式的根本性变革。随着各国海军在各类尺寸和能力谱系上加速无人水下航行器开发项目，这些自主平台正成为未来舰队架构中不可或缺的组成部分，它们扩展作战半径、维持持久存在，并完成先前不可能或风险过高的任务。

人工智能、先进传感器、改进的能源系统和复杂的自主算法的融合，已达到一个临界点，使得真正具有作战能力的水下机器人而不仅仅是实验原型成为可能。诸如美海军“逆戟鲸”、“蛇头”和“刀鱼”等项目，展现了美军机构致力于将这些技术从概念转化为可部署能力的动机。随着测试的推进和早期作战经验的积累，条令框架、训练项目和支持基础设施也日趋成熟，以将无人系统与传统平台整合。

驱动这一变革的战略必要性超越了技术可能性，延伸至作战需求。当代安全挑战包括近邻对手的潜艇扩散、水下基础设施的脆弱性以及对抗性区域的进入，这些都需要自主系统独特提供的能力。在无需承担船员风险的情况下，维持持久监视、实施分布式作战并在拒止区域行动的能力，弥补了当前海军能力的关键缺口，同时在大国竞争中提供了非对称优势。

然而，要实现自主水下作战的全部潜力，需要持续的投资、针对复杂威胁的逼真测试，以及在多个技术前沿的持续创新。必须同时发展平台本身、将其整合到舰队作战中、建立有效的指挥控制框架，并与伙伴合作以最大化协同能力。这项事业的成功将在未来几十年大幅提升海上安全，而失败则可能将在水下领域的优势拱手让给正积极发展其自身自主系统的战略竞争对手。

正在水下发生的这场静默革命，其最终影响可能不亚于以往从风帆到蒸汽、从水面到水下、从常规动力到核动力的海军转型。随着隐身无人潜航器的扩散和成熟，它们将从根本上重塑海战的特性，改变战略平衡、作战概念以及海上力量的根本性质。率先掌握这些技术的国家，将在定义21世纪海战的水下领域竞争中享有显著优势。

参考来源：thedefensewatch

成为VIP会员查看完整内容

AI与军事 · 无人艇 ·

《海上自主水面船舶远程操作中心：安全可持续运行的多维度分析》

海事领域自主系统的兴起，正从根本上改变着远程操作中心的作用。远程操作中心是集中式设施，能够对远程海上船舶进行实时监视、管理与控制。本文在海上自主水面船舶的背景下，对远程操作中心的多方面问题进行了全面审视，探讨了从现有法律框架、人为因素到技术基础设施和人员培训等一系列主题。考虑到国际海事组织关于在2032年前强制实施《海上自主水面船舶规则》的路线图，本研究从运行、人员、技术和法律等多个维度，分析了远程操作中心的现状与未来要求。它探讨了用于降低人为失误和错误决策的风险管理策略、相比传统方法在培训和职业规划方面的现代化改进，以及远程操作人员的心理健康。最终，本研究提出了战略性建议，以确保远程操作中心在未来的海事运行中能够安全、高效且可持续地运作。

成为VIP会员查看完整内容