设计应用

用于巡航导弹突防航迹规划的改进深度强化学习算法

作者：马子杰，高杰，武沛羽，谢拥军

发布日期：2021-07-28

来源：2021年电子技术应用第8期

0 引言

巡航导弹是一种能机动发射、命中精度高、隐蔽性强、机动性能强的战术打击武器，但近年来由海陆空防御武器整合得到的体系化信息化反导防御系统态势感知能力和区域拒止能力都得到了极大的提升，巡航导弹的战场生存能力受到威胁，提升巡航导弹规避动态威胁的能力成为其能否成功打击目标的关键^[1-3]。传统的巡航导弹航迹规划方法中将雷达威胁建模为一个静态的雷达检测区域，这难以适应对决策实时性要求较高的动态战场环境，而且其缺乏探索先验知识以外的突防策略的能力，需要研究能应对动态对抗的巡航导弹智能航迹规划算法。

深度强化学习是人工智能领域新的研究热点^[4-6]。随着深度强化学习研究的深入，其开始被应用于武器装备智能突防，文献[7]利用深度强化学习提出了一种新的空空导弹制导律，提高了打击目标的能力。文献[8]针对目标、打击导弹、拦截导弹作战问题，探究了是否发射拦截导弹、拦截导弹的最佳发射时间和发射后的最佳导引律。文献[9]利用深度价值网络算法探究了静态预警威胁下的无人机航迹规划问题，提升了航迹规划的时间。文献[10]将雷达威胁建模为一个静态的雷达检测区域，在二维平面探究了巡飞弹动态突防控制决策问题，提高了巡飞弹的自主突防能力。

本文详细内容请下载：http://www.chinaaet.com/resource/share/2000003690。

作者信息：

马子杰，高杰，武沛羽，谢拥军

(北京航空航天大学电子信息工程学院，北京100191)

原创声明：此内容为AET网站原创，未经授权禁止转载。

巡航导弹 DDPG算法突防策略深度强化学习

AET陪你走进工业以太网

何为现代数字城市？

《电子技术应用》全年合订本-电子版

SDV软件定义汽车技术专题

北斗导航系统的应用前景和案例展示