重磅!西工大李学龙团队研发大模型自主无人机集群!

在线群聊极大地方便了人们的沟通方式,能否把机器也拉进群,让它们组团商量着干活,并和人类无障碍地沟通和交流,更好地服务于生产生活?

语言是人类交流和思维呈现最为重要的符号系统,是推动人类文明的重要力量,那么机器能否用语言进行交互,表达自己的所见、所听、所想,成为真正的智能机器人呢?近日,西北工业大学光电与智能研究院李学龙教授和同事们在机器交互方面取得创新进展:基于国产大模型,研发了“群聊式”无人机控制框架,给每架无人机装上了大脑,让无人机集群在语言沟通中动态协同,实现了开放环境下“人机”和“多机”的对话交互,打破人类和机器的交互壁垒,进一步拓展了临地安防的应用场景。

超强的泛化能力,让大模型成为“通用人工智能”的一缕曙光。然而,读万卷书,不如行万里路。在开放环境中,大模型需要真正地“走”进物理世界,才能切实地理解复杂任务、解决实际问题。

近日,李学龙教授团队在开放环境中的自主无人机集群方面开展了创新研究,让大模型插上翅膀,飞入我们的现实生活中。

受人类的认知模式启发,团队将认知形成的高度自主性凝练为“思维计算—实体控制—环境感知”的三元交互,建立了“书生–浦语”开源大模型驱动的自主无人机“群聊式”控制框架,实现了开放环境和复杂任务中的智能交互、主动感知和自主控制,提高了无人机任务执行的自主性。

总体而言,类人对话交互、主动环境感知、自主实体控制,是自主无人机集群的主要能力。

1、类人对话交互

图一 无人机群聊沟通

探索人类用户与无人机的交互方式,让无人机理解复杂任务中的用户需求,是实现自主无人机的前提条件。

针对此,团队提出“群聊式”对话交互方法,将声音、图像和无人机自身状态等多种信息,通过大模型转换为自然语言的对话形式,实现了用户与无人机,以及无人机与无人机之间自主和直观的交互方式。同时,团队设计了一套高效的实时反馈机制,使得无人机能够在任务执行的关键节点通过对话报告自身状态、寻求用户确认,大大提高了复杂任务执行的稳定性和安全性。

2、主动环境感知

图二 主动发现并靠近目标

图三 动态环境避障

在飞行过程中,无人机主动感知外部环境,实时调整任务规划,是完成复杂任务的关键环节。

针对此,团队设计了任务引导的主动感知机制,提出了多传感器融合的低空搜索、动态避障和视觉定位算法。在实际任务执行中,根据感知信息和任务目标,动态调整无人机飞行路径和观测位姿,尝试从不同角度和位置感知周围世界,逐渐降低环境中的不确定性,实现高效的信息采集和任务执行。

3、自主控制

图四 自主目标抓取

图五 异构无人机集群协同控制

探索复合智能体形态,增强复杂任务处理能力,是大模型时代新型智能体的研究重点。

针对此,团队依托无人机平台设计了夹爪等末端执行器,将传统无人机拓展为“飞行机器人”,长出“手”来,具备抓取能力。同时,构建了异构无人机集群协同控制机制,结合环境感知反馈,实时调整无人机编队的飞行状态,使集群分工执行区域搜索、目标定位和抓取等任务。

大模型自主无人机集群是团队将生物智能 “思维计算—实体控制—环境感知”的三元交互模式应用于自主智能体的一次成功尝试,依托大语言模型、无人机平台和多种传感器,实现对话交互、主动感知和自主控制,对安防巡检、灾害救援、空中物流等临地安防场景下的应用具有重要意义。

拓展阅读:

李学龙, 临地安防(Vicinagearth security), 中国计算机学会通讯, 18(11), 44-52, 2022.

全文下载:

https://dl.ccf.org.cn/article/articleDetail.html?type=xhtx_thesis&_ack=1&id=6219452051015680

相关推荐

  • 8年干出千亿市值,东南亚最大快递IPO了
  • 李克强:大力发展新一代信息技术、人工智能、数字经济等(2020 年 1 月)
  • 再看大模型微调数据质量如何评估:已有方法回顾及IFD指令遵循难度筛选的思路与聚类细节
  • Python制作进度条,原来有这么多方法
  • 顶级ML后端工程师“进化”指南
  • Instagram 仅 3 名工程师,如何做到 1400 万用户?
  • 第五要素|大模型时代,数据治理与AI相互依存形成闭环
  • 纵腾湖仓全链路落地实践
  • Midjourney重大升级,网页版正式上线!生成图像真实清晰
  • 港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构
  • 陶哲轩论文漏洞竟被AI发现,26年预言要成真!看定理名猜出研究方向,大神直呼AI能力惊人
  • 中美程序员不完全对比,太真实了。。。
  • 生成的分子几乎 100% 有效,用于逆向分子设计的引导扩散模型
  • 小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大
  • 多模态搜索算法如何让视频搜索更精准?腾讯独家揭秘,超详细
  • 谷歌20亿美元砸向Anthropic:大模型军备竞赛升级
  • 国内唯一全面对标OpenAI的创业公司,大模型已经出到第三代
  • 阿里语雀突发P0级事故,一度崩溃8小时!故障原因和补偿来了。
  • 索尼本田社长有些酸:“中国电动车没有技术创新,只是排列APP图标”
  • 有限状态机在国际计费中的应用探索