实现自主能力最关键步骤之一,是将大语言模型(LLM)集成到无人机系统(IoD)生态中,从而成功将自然语言指令转换为可执行的API调用。本研究引入一种端到端的基于LLM的框架,用于增强实时无人机操作和问题处理能力,涵盖意图识别、参数提取和歧义消解。该框架采用了检索增强生成(RAG)及针对特定领域的定制微调等一系列方法,以实现精确的指令解释和成功的API生成。本文在一个精心设计的数据集上评估了模型性能,该数据集包含1,500条针对不同无人机系统场景的指令,模型平均BLEU得分达到89.6,余弦相似度为0.94。通过并行处理和优化查询处理等优化技术,系统延迟降低了15%,平均查询处理时间为0.9秒。此项工作高度重视系统的可扩展性和灵活性,这对灾害响应、精准农业和监视等领域的应用至关重要。因此,所提出的基于LLM的框架试图弥合人类意图与无人机执行之间的差距,以实现直观、可靠和高效的无人机系统部署。