第4卷 第1期 Vol. 4,No. 1 空天防御 2021 年 3 月 Mar. ,2021 AIR & SPACE DEFENSE 基于神经网络的防空武器目标智能分配方法 龙 腾 1,2,刘震宇 1,史人赫 1,王生印 1 (1. 北京理工大学 宇航学院,北京 100081; 2. 北京理工大学 飞行器动力学与控制教育部重点实验室,北京 摘 100081) 要:为满足现代防空作战高动态环境对武器目标实时智能分配的迫切需求,提出了一种基于神经网络的防空 武器目标智能分配方法。首先综合考虑武器数量及拦截能力等要素,以毁伤效能最大为优化目标,建立武器目标分 配问题优化模型;在此基础上,构建基于神经网络的武器目标智能分配框架,基于分配方案数据集训练武器分配决 策神经网络,并通过神经网络预测实现当前武器资源对威胁目标的准确高效分配。仿真结果表明,相比于传统基于 离散差分进化的规划求解方法,基于神经网络的防空武器目标智能分配方法能够获取毁伤效能更优的武器目标分 配方案,且计算成本降低了 99.9% 以上,从而验证了所提方法的有效性和实用性。 关键词:防空作战;武器目标分配; 毁伤效能;任务规划;神经网络 中图分类号:E91 文献标志码:A 文章编号:2096-4641(2021)01-0001-07 Neural Network Based Air Defense Weapon Target Intelligent Assignment Method LONG Teng1,2,LIU Zhenyu1,SHI Renhe1,WANG Shengyin1 (1. School of Aerospace Engineering,Beijing Institute of Technology,Beijing 100081,China; 2. Key Laboratory of Dynamics and Control of Flight Vehicle of Ministry of Education,Beijing Institute of Technology,Beijing 100081,China) Abstract: To address the challenge of the real-time weapon target intelligent assignment in modern high dynamic air defense operation, a neural network based air defense weapon target intelligent assignment method is proposed in this paper. An optimization model for weapon target assignment is first established considering the number of weapons and interception capability in order to optimize the damage efficiency. A neural network based weapon target intelligent as⁃ signment framework is then developed, where a neural network is constructed based on the existed training sample set and employed to assign the weapons to the targets effectively and efficiently. The comparison results illustrate that the neural network based air defense weapon target assignment method can obtain better weapon target assignment solution compared with the conventional discrete differential evolution based assignment method. Moreover, the computational cost of the proposed method can be reduced by 99. 9%, which demonstrates the effectiveness and practicability of the research work. Keywords: air defense;weapon target assignment;damage efficiency;task planning;neural network 0 引 言 随着隐身战斗机、无人作战飞机、弹道导弹、巡航 导弹等先进武器的不断发展,空中打击已成为现代战 争中非常普遍的作战手段[1],提升防空武器系统的毁 伤效能对国家国土防御具有重要的现实意义[2]。考虑 收稿日期:2021-02-05;修订日期:2021-02-08 基金项目:国家自然科学基金(51675047, 52005288);中国博士后科学基金(2019M660668) 作者简介:龙腾(1982—),男,博士,教授,主要研究方向为飞行器总体设计、多学科优化理论与应用、飞行器协同控制与决策。 Email: tenglong@bit.edu.cn · 2· 第4卷 空天防御 到战争成本问题,合理筹划武器拦截目标方案以发挥 署 m 枚防空导弹。在本文建立的防空武器目标分配 其 最 大 作 战 效 能 ,成 为 战 争 中 防 御 方 面 临 的 巨 大 优化问题模型中,来袭目标具有不同的威胁度,各防 挑战。 空导弹具有不同的拦截能力,此外,同一防空导弹针 武器目标分配(weapon target assignment,WTA) 对不同的目标也具有不同的拦截概率。协同防空武 问题的基本任务是通过将防御方的武器合理地分配 器目标分配优化问题可描述为:考虑可用武器数量、 到不同目标,实现武器毁伤效能最大化[3-4]。武器目标 对每个来袭目标可分配的拦截武器数量上限以及各 分配方法根据系统架构的不同,可分为集中式武器目 枚武器对来袭目标的可拦截性等约束条件,通过合理 标分配[5]和分布式武器目标分配[6]。其中,基于集中 分配防空导弹拦截各来袭目标,使防御方对来袭方的 式架构的 WTA 问题类似于组合优化问题,其求解方 毁伤效能最大。 法包括经典的整数规划和现代启发式优化算法。整 数规划方法主要包括穷举法、隐枚举法、分支定界法 和割平面法等 ,主要用于求解简单的 WTA 问题 。 [5] 建立防空武器目标分配问题优化模型,如式(1) 所示。 [7] 对于涉及较多约束条件的 WTA 问题,主要采用启发 式优化算法求解[8-9]。Johnson 和 Falkman[10]采用粒子 群优化(particle swarm optimization,PSO)方法求解中 小规模的 WTA 问题,并与穷举法进行对比,结果显示 PSO 算法能够有效获取可行分配方案。张春梅等[11] 针对 WTA 问题的离散特性,提出了一种新的离散差 分 进 化(discrete differential evolutionary,DDE)算 法 , 实现了 WTA 问题的高效求解。然而,传统基于规划/ 优化的武器目标分配方法往往需要较长时间来获得 优化后的可行分配方案,难以满足防空武器目标分配 实时性需求。 考虑到现代防空作战的高动态战场环境,WTA 问题求解的计算效率与全局收敛性亟需得到进一步 提升。近年来,部分学者利用以深度学习[12]、强化学 习[13]为代表的机器学习方法实现了分配问题实时智 能求解。Zappone 等[14]以通信频道信息为输入,训练 max f ( x )= é ù ∑ V ê1 - ∏( 1 - p x )ú n m j ë ij i=1 目标 j 的威胁程度,威胁度越高表示来袭目标越需要 被拦截;p ij 表示防空导弹 i 对来袭目标 j 的拦截概率, 拦截概率越大代表该枚导弹拦截对应目标的能力越 强;x ij 表示设计变量,若分配防空导弹 i 拦截来袭目标 j,则设计变量 x ij = 1,反之 x ij = 0;约束条件 g 1 为设计 变量取值范围;约束条件 g 2 为分配给来袭目标 j 的最 大武器数量限制,避免防空资源浪费;约束条件 g 3 为 深度神经网络以预测各频道所需发射功率,从而提高 每枚导弹最多拦截 1 个来袭目标。 通信资源配置的合理性。Ahmed 等[15]使用遗传算法 2 求解多晶胞网络中的子带和能源分配问题,将获取的 分配结果作为神经网络的训练数据,并对预测准确率 与网络隐层数以及训练数据量的关系进行了对比和 分析。 ij û s.t. ìg 1:x ij ∈ { 0,1 }, i = 1,2,…,m;j = 1,2,…,n ï m ï j = 1,2,…,n ï g 2:∑ x ij ≤ u j, (1) í i=1 ï n ï g : x ≤ 1, i = 1,2,…,m ï 3 ∑ ij j=1 î 式中:f ( ⋅ ) 表示防空武器毁伤效能函数;V j 表示来袭 j=1 2. 1 基于神经网络的防空武器目标分配 方法 基于神经网络的防空武器目标分配总 体流程 为进一步提高武器目标分配方法的求解效率和 为了实现防空武器目标分配问题的智能高效求 全局收敛性,本文提出了一种基于神经网络的防空武 解,本文构建了一种武器目标智能分配框架,其流程 器目标智能分配方法,利用已有分配方案样本信息挖 如图 1 所示,具体步骤叙述如下。 掘防空武器目标分配的潜在规则,构建了能够表征武 步 骤 1:根 据 当 前 防 空 作 战 任 务 想 定 ,采 用 文 器杀伤率与武器分配概率特性之间内在关系的前馈 献[16]中给出的基于双染色体整数编码的 DDE 算法 神经网络用以实现分配方案决策,实现对 WTA 问题 求解式(1)中的防空武器目标分配模型,获得武器目 的高效求解。 标分配方案训练样本集。 1 防空武器目标分配问题建模 假设来袭方发射了 n 个来袭目标,此时防御方部 步骤 2:按照来袭目标威胁度从高到低,对来袭目 标进行排序,构建来袭目标集合。 步骤 3:以当前威胁度最高的来袭目标为对象,从 第1期 龙 · 3· 腾,等:基于神经网络的防空武器目标智能分配方法 步骤 7:判断防空武器是否有剩余。若有剩余,则 回到步骤 2,重复上述火力分配过程(若来袭目标已全 部得到分配,则从威胁度最高的目标开始继续分配); 反之进入步骤 8。 步骤 8:根据火力分配结果,生成任务分配矩阵, 得到防空武器目标分配毁伤效能指标值,计算过程 结束。 2. 2 武器分配决策神经网络训练方法 本文构建的武器分配决策神经网络是一种单隐 层的全联通前馈神经网络,基本思想是将输入层的杀 伤概率向量利用隐含层进行处理,传输至输出层形成 武器对当前目标的分配概率,并通过反向传播(back propagation,BP)算法调整网络的权值与阈值,使神经 网络的预测分配结果逼近期望分配结果。典型的单 隐层神经网络拓扑结构如图 3 所示,其训练过程简单 总结如下。 图1 Fig. 1 基于神经网络的防空武器目标分配流程图 Flowchart of the neural network based air defense weapon target assignment 防空杀伤概率矩阵中提取防空武器对当前目标的杀 伤概率向量(即杀伤概率矩阵中的列向量)。 步骤 4:基于现有武器目标分配方案样本集,训练 如图 2 所示的武器分配决策神经网络,具体训练流程 见 2.2 节。将防空武器对当前目标的杀伤概率向量作 为神经网络的输入,通过前馈传播得到输出向量,即 每个武器对该目标的分配概率。 图3 Fig. 3 典型单隐层神经网络拓扑结构示意图 Typical single hide layer neural network topology 步骤 1:网络初始化。根据武器数量确定网络输 入 层 节 点 数 n in、输 出 层 节 点 数 n out 和 隐 含 层 节 点 数 n hid。给定初始输入层与隐含层之间各节点之间的连 接权值矩阵 ω = [ ω ij ] n in × n hid 、初始隐含层与输出层之间 的各节点之间的连接权值矩阵 β = [ β ij ] 图2 Fig. 2 武器分配决策神经网络示意图 Neural network for weapon assignment decision 阈 值 向 量 a = [ aj ] [b ] k 步骤 5:判断输出向量中最大元素项的索引,作为 分配给当前来袭目标的武器编号。 步骤 6:将当前来袭目标从目标库中移除;在杀伤 n out × 1 n hid × 1 n hid × n out 、隐含层 以 及 输 出 层 阈 值 向 量 b= 。 步骤 2:隐含层输出计算。根据防空武器对某一 目标的杀伤概率向量 x = [ x i ] n in × 1 ,输入层与隐含层间 概率矩阵中,将分配后的武器对各目标杀伤概率设 的连接权值矩阵 ω 以及隐含层阈值向量 a,计算隐含 置为 0。 层输出值向量 h,计算表达式为 · 4· 第4卷 空天防御 hj = g (∑ n in i=1 ) ω ij x i - a j , j = 1,2,…,n hid 的阈值向量 a 与 b,其计算表达式为 (2) a j = a j + ηh i ( 1 - h i ) 式中:x i 为第 i 枚武器对当前目标的杀伤概率;g(∙)为 bk = bk + ek , 隐含层激励函数,本文选用 Sigmoid 函数作为激励函 n out ∑β k=1 jk e k , j = 1,2,…,n hid (8) k = 1,2,…,n out (9) 步骤 7:判断训练过程是否达到最大迭代次数,若 数,如式(3)所示。 未结束则执行步骤 2。 1 (3) 1 + e-x 步骤 3:输出层输出计算。根据隐含层的输出值 s( x )= 防空武器目标分配仿真验证 3 向量 h、隐含层与输出层间的连接权值矩阵 β 以及阈 本章采用基于神经网络的防空武器目标智能分 值向量 b,计算神经网络预测输出 ŷ k,即各武器对当前 配方法求解两个防空武器目标分配案例,并与集中式 架构的 DDE 方法对比,验证本文提出方法的有效性。 目标的分配概率。 ŷ k = n hid ∑h β j jk j=1 - b k , k = 1,2,…,n out 其中,想定 I 为 20 枚武器拦截 20 个来袭目标;想定 II (4) 为 20 枚武器拦截 12 个来袭目标。 两种想定下的神经网络训练参数如下:神经网络 步骤 4:误差计算。根据网络预测输出向量 ŷ 与期 输入层、输出层与隐层神经元数量均设为 20;隐层神 望武器对各目标的分配概率向量 y,可得神经网络预 经元类型为 Sigmoid;输出层神经元类型为 Softmax; 测误差为 e k = y k - ŷ k , k = 1,2,…,n out 训练误差损失函数为交叉熵误差损失函数,学习率为 (5) 0.1,最大训练轮数为 20 000;训练样本规模为 200,训 步骤 5:权值更新。根据神经网络预测误差更新 练样本集通过 DDE 算法构造。 网络连接权值 ω ij 与 β jk 为 3. 1 n out ω ij = ω ij + ηh j ( 1 - h j ) x i ∑ ω jk e k, k=1 i = 1,2,…,n in ; j = 1,2,…,n hid 想定 I 中,来袭目标的威胁度如表 1 所示,防空武 (6) 器对来袭目标的杀伤概率如表 2 所示。基于训练的神 β jk = β jk + ηh j e k, j = 1,2,…,n hid ; k = 1,2,…,n out 经网络,根据来袭目标威胁矩阵和防空武器杀伤概率 (7) 式中:η 为学习速率。 矩阵,输出武器目标分配矩阵,得到防空武器目标分 配结果,如表 3 所示。 步骤 6:阈值更新。根据网络预测误差更新节点 表1 Tab. 1 想定 I 仿真结果对比与分析 想定 I 目标威胁度 Targets’threat degree in scenario I 目标编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 威胁度 17 51 78 36 29 15 91 27 34 5 8 5 19 16 14 11 1 13 2 17 同时采用 DDE 算法连续求解上述防空武器目标 分配问题 50 次。与基于神经网络的防空武器目标分 配方法求解结果对比如表 4 所示。 从表 3 可以看出,对于威胁度高的目标,分配了目 标杀伤概率高的武器对其进行攻击,说明了防空武器 决策过程仅需要进行多项式计算,因此具有更高的计 算效率。 3. 2 想定 II 仿真结果对比与分析 想定 II 中,来袭目标的威胁度如表 5 所示,防空武 目标分配结果的合理性。从表 4 可以看出,基于神经 器对来袭目标的杀伤概率如表 6 所示。基于训练好的 网络的防空武器目标分配方法求得的防空毁伤效能 神经网络,根据来袭目标威胁度矩阵和防空武器杀伤 函数值相比于基于 DDE 的分配方法求得的防空毁伤 概率矩阵,输出武器目标分配矩阵,得到防空武器目 效能函数值增加了 9.9%。此外,基于 DDE 算法的防 标分配结果,如表 7 所示。 经网络的防空武器目标分配耗时则在 5 ms 以内,其计 分配问题 50 次。与基于神经网络的防空武器目标分 空武器目标分配耗时平均约为 6.7 s,相比之下基于神 算成本降低了 99.9% 以上。这是由于神经网络分配 同时采用 DDE 算法连续求解上述防空武器目标 配方法求解结果对比如表 8 所示。 第1期 龙 表2 Tab. 2 · 5· 腾,等:基于神经网络的防空武器目标智能分配方法 想定 I 防空武器对目标杀伤概率 Air defense weapon damage probability to target in scenario I 目标编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 武器 1 0.67 0.73 0.09 0.62 0.53 0.84 0.91 0.76 0.76 0.96 0.20 0.90 0.01 0.46 0.11 0.19 0.90 0.09 0.54 0.75 武器 2 0.43 0.37 0.61 0.60 0.83 0.58 0.55 1.00 0.56 0.12 0.20 0.70 0.73 0.64 0.41 0.75 0.58 0.32 0.99 0.54 武器 3 0.69 0.58 0.01 0.17 0.86 0.95 0.03 0.19 0.18 0.05 0.33 0.38 0.35 0.92 0.88 0.35 0.58 0.77 0.76 0.34 武器 4 0.26 0.12 0.57 0.09 0.79 0.06 0.05 0.78 0.50 0.30 0.88 0.73 0.78 0.16 0.55 0.42 0.85 0.23 0.98 0.83 武器 5 0.01 0.06 0.79 0.26 0.32 0.58 0.81 0.20 0.52 0.58 0.47 0.95 0.44 0.72 0.37 0.16 0.03 0.74 0.23 0.55 武器 6 0.53 0.98 0.24 0.86 0.45 0.29 0.45 0.99 0.99 0.53 0.40 0.54 0.44 0.58 0.21 0.82 0.89 0.69 0.53 0.96 武器 7 0.28 0.28 0.45 0.91 0.75 0.83 0.38 0.80 0.85 0.90 0.18 0.54 0.05 0.43 0.44 0.62 0.41 0.82 0.05 0.89 武器 8 0.95 0.59 0.57 0.70 0.11 0.19 0.79 0.42 0.96 0.54 0.97 0.31 0.05 0.88 0.96 0.74 0.04 0.83 0.76 0.36 武器 9 0.91 0.96 0.06 0.73 0.11 0.44 0.36 0.73 0.68 0.43 0.41 0.07 0.09 0.39 0.12 0.81 0.75 0.29 0.60 0.55 武器 10 0.39 0.19 0.50 0.23 0.27 0.39 0.53 0.50 0.40 0.54 0.84 0.18 0.59 0.18 0.47 0.07 0.15 0.31 0.86 0.35 武器 11 0.02 0.19 0.64 0.58 0.52 0.83 0.71 0.81 0.93 0.71 0.62 0.09 0.24 0.63 0.86 0.95 0.14 0.52 0.99 0.62 武器 12 0.67 0.34 0.22 0.81 0.97 0.68 0.87 0.36 0.48 0.02 0.38 0.46 0.84 0.62 0.04 0.50 0.61 0.33 0.93 0.80 武器 13 0.84 0.93 0.84 0.40 0.71 0.21 0.33 0.07 0.23 0.80 0.88 0.01 0.86 0.33 0.69 0.76 0.25 0.83 0.41 0.75 武器 14 0.97 0.39 0.97 0.99 0.31 0.32 0.65 0.59 0.40 0.14 0.78 0.92 0.96 0.80 0.98 0.74 0.32 0.81 0.00 0.13 武器 15 0.06 0.27 0.85 0.09 0.29 0.13 0.97 0.91 0.71 0.48 0.46 0.64 0.49 1.00 0.28 0.83 0.40 0.56 0.54 0.82 武器 16 0.45 0.15 0.51 0.32 0.85 0.67 0.08 0.19 0.56 0.26 0.81 0.00 0.22 0.98 0.13 0.16 0.41 0.26 0.21 0.03 武器 17 0.58 0.40 0.28 0.51 0.91 0.57 0.59 0.43 0.76 0.37 0.90 0.03 0.23 0.13 0.69 0.46 0.39 0.68 0.22 0.41 武器 18 0.69 0.37 0.75 0.06 0.64 0.17 0.41 0.75 1.00 0.66 0.43 0.21 0.54 0.23 0.91 0.62 0.61 0.23 0.33 0.73 武器 19 0.72 0.13 0.24 0.73 0.26 0.15 0.31 0.04 0.96 0.17 0.33 0.45 0.76 0.02 0.61 0.93 0.17 0.46 0.10 0.78 武器 20 0.65 0.44 0.96 0.56 0.09 0.48 0.26 0.95 0.54 0.28 0.60 0.13 0.35 0.61 0.90 0.84 0.19 0.38 0.75 0.37 表3 Tab. 3 想定 I 防空武器目标分配方案 Air defense weapon target assignment scheme in scenario I 目标编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 武器编号 9 6 20 7 12 3 15 4 18 10 8 5 19 16 14 11 1 13 2 17 表4 Tab. 4 想定 I 防空武器毁伤效能函数值对比 高防空毁伤效能,说明了武器目标分配结果的合理性。 由表 8 可知,基于神经网络的防空武器目标分配方法求 Comparison of damage efficiency function values 得的防空武器毁伤效能函数值相比于基于 DDE 的分 of air defense weapon in scenario I 基于 DDE 的防空 基于神经网络的防空 武器目标分配方法 武器目标分配方法 函数值 函数值 最优值 813.13 852.91 平均值 776.40 852.91 中位数 774.69 852.91 函数值类型 配方法求得的防空武器毁伤效能函数值提高了 6.2%。 此外,基于 DDE 算法的防空武器目标分配耗时平均约 为 5.6 s,而基于神经网络的防空武器目标分配耗时仅 需约 5 ms,在计算效率上具有显著优势。 上述仿真结果表明,本文提出的基于神经网络的 防空武器目标智能分配方法相较于基于 DDE 的分配 由表 7 可知,对于来袭目标威胁度较大的目标,分 方法具有更好的收敛性和更高的求解效率,能够满足 配了多个对该目标杀伤概率大的武器进行打击,以提 表5 Tab. 5 武器目标实时智能分配需求。 想定 II 目标威胁度 Targets’threat degree in scenario II 目标编号 1 2 3 4 5 6 7 8 9 10 11 12 威胁度 17 51 78 36 29 15 91 27 34 5 20 52 · 6· 表6 Tab. 6 想定 II 防空武器对目标杀伤概率 Air defense weapon damage probability to target in scenario II 目标编号 1 2 3 4 5 6 7 8 9 10 11 12 武器 1 0.11 0.75 0.06 0.78 0.28 0.28 0.34 0.10 0.27 0.80 0.09 0.40 武器 2 0.46 0.37 0.82 0.91 0.68 0.98 0.85 0.86 0.75 0.23 0.40 0.17 武器 3 0.45 0.94 0.53 0.78 0.90 0.04 0.25 0.70 0.90 0.60 0.30 0.58 武器 4 0.55 0.02 0.69 0.30 0.91 0.33 0.58 0.73 0.73 0.11 0.31 0.61 武器 5 0.81 0.83 0.21 0.15 0.75 0.97 0.94 0.65 0.41 0.52 0.11 0.21 武器 6 0.70 0.63 0.54 0.85 0.26 0.37 0.05 0.52 0.94 0.84 0.59 0.52 武器 7 0.87 0.54 0.70 0.78 0.69 0.31 0.05 0.33 0.26 0.92 0.28 0.99 武器 8 0.05 0.65 0.96 0.27 0.13 0.12 0.02 0.66 0.53 0.50 0.16 0.49 武器 9 0.22 0.73 0.44 0.23 0.12 0.92 0.68 0.12 0.95 0.28 0.00 0.69 武器 10 0.46 0.09 0.09 0.32 0.19 0.14 0.60 0.15 0.27 0.65 0.28 0.41 武器 11 0.96 0.88 0.06 0.83 0.15 0.33 0.11 0.02 0.25 0.92 0.55 0.03 武器 12 0.79 0.01 0.63 0.82 0.59 0.90 0.80 0.96 0.93 0.51 0.87 0.29 武器 13 0.45 0.29 0.80 0.57 0.07 0.50 0.62 0.97 0.07 0.97 0.04 0.80 武器 14 0.33 0.18 0.69 0.57 0.82 0.62 0.07 0.12 0.30 0.20 0.90 0.35 武器 15 0.06 0.93 0.35 0.29 0.72 0.58 0.07 0.47 0.59 0.11 0.13 0.08 武器 16 0.74 0.07 0.95 0.70 0.93 0.70 0.14 0.66 0.20 0.30 0.83 0.51 武器 17 0.51 0.58 0.52 0.80 0.49 0.03 0.79 0.29 0.64 0.40 0.80 0.37 武器 18 0.20 0.64 0.95 0.44 0.65 0.53 0.09 0.75 0.80 0.42 0.92 0.74 武器 19 0.43 0.65 0.07 0.45 0.89 0.03 0.24 0.56 0.50 0.31 0.14 0.52 武器 20 0.17 0.86 0.21 0.47 0.54 0.83 0.24 0.43 0.65 0.69 0.50 0.80 表7 Tab. 7 想定 II 防空武器目标分配方案 Air defense weapon target assignment scheme in scenario II 目标编号 1 2 3 4 5 6 7 8 9 10 11 12 武器编号 11 3,15 4,8 1,2 14,16 12 5,17 10,13 9,19 6 18 7,20 表8 Tab. 8 想定 II 防空武器毁伤效能函数值对比 Comparison of damage efficiency function values of air defense weapon in scenario II 基于 DDE 的防空 基于神经网络的防空 武器目标分配方法 武器目标分配方法 函数值 函数值 最优值 432.93 445.21 平均值 419.15 445.21 中位数 418.61 445.21 函数值类型 4 第4卷 空天防御 结束语 为实现防空武器目标分配问题的智能快速求解, 本文提出了一种基于神经网络的防空武器目标智能 分配方法。通过已有样本数据构建神经网络,在不依 赖优化或规划求解的情况下实现防空武器资源智能 分配,实现武器目标杀伤概率与分配概率映射关系的 仿真案例结果表明,相比于基于 DDE 算法的防空武器 目标分配方法,本文方法得到的防空武器目标分配方 案在毁伤效能方面具有一定优势,且计算效率得到了 显著提升,对于实现高动态环境下的防空火力资源在 线自主分配具有重要意义。 参 考 文 献 [ 1 ]张瑞通,刘法明,张银涛 . 联合防空作战初探[J]. 科技信息, 2011, (21):494. [ 2 ]王义,陈运涛,周永亮 . 未来防空系统在赛博战中的影响研究 [C]//2014 第二届中国指挥控制大会论文集 . 北京:国防工业 出版社,2014:573-577. [ 3 ]CHANG T Q,KONG D P,HAO N,et al. Solving the dy⁃ namic weapon target assignment problem by an improved artifi⁃ cial bee colony algorithm with heuristic factor initialization[J]. Applied Soft Computing,2018,70:845-863. [ 4 ]DAVIS M T,ROBBINS M J,LUNDAY B J. Approximate dynamic programming for missile defense interceptor fire control 快速预示,从而提升防空武器目标分配问题的求解效 [J]. European Journal of Operational Research,2017,259 率,同时保证获得的分配方案具有较高的毁伤效能。 (3):873-886. 第1期 龙 腾,等:基于神经网络的防空武器目标智能分配方法 [ 5 ]TOKGöZ A,BULKAN S. Weapon target assignment with combinatorial optimization techniques[J]. International Journal of Advanced Research in Artificial Intelligence,2013,2(7): 39-50. [ 6 ]唐苏妍,梅珊,朱一凡,等 . 基于扩展合同网协议的分布式武 器 目 标 分 配 方 法[J]. 系 统 工 程 与 电 子 技 术 ,2011,33(3): 568-574. [ 7 ]LU H Q,ZHANG H J,ZHANG X J,et al. An improved ge⁃ netic algorithm for target assignment,optimization of naval fleet air defense[C]//2006 6th World Congress on Intelligent Con⁃ trol and Automation. Dalian:IEEE,2006:3401-3405. [ 8 ]李勇君,黄卓,郭波 . 武器-目标分配问题综述[J]. 兵工自动 化,2009,28(11):1-4. [ 9 ]AHUJA R K,KUMAR A,JHA K C,et al. Exact and heuris⁃ tic algorithms for the weapon-target assignment problem[J]. Operations Research,2007,55(6):1136-1146. [10]JOHANSSON F,FALKMAN G. Real-time allocation of de⁃ fensive resources to rockets,artillery,and mortars[C]//2010 13th International Conference on Information Fusion. Edin⁃ · 7· burgh,UK:IEEE,2010:1-8. [11]张春美,陈杰,辛斌 . 武器目标分配问题的离散差分进化算法 [J]. 北京理工大学学报,2014,34(3):289-293. [12]LECUN Y,BENGIO Y,HINTON G. Deep learning[J]. Na⁃ ture,2015,521(7553):436-444. [13]MOUSAVI S S,SCHUKAT M,HOWLEY E. Deep rein⁃ forcement learning:an overview[C]//Proceedings of SAI Intel⁃ ligent Systems Conference(IntelliSys)2016. Cham:Springer International Publishing,2017:426-440. [14]ZAPPONE A,DEBBAH M,ALTMAN Z. Online energyefficient power control in wireless networks by deep neural net⁃ works[C]//2018 IEEE 19th International Workshop on Signal Processing Advances in Wireless Communications(SPAWC). Kalamata,Greece:IEEE,2018:1-5. [15]AHMED K I,TABASSUM H,HOSSAIN E. Deep learning for radio resource allocation in multi-cell networks[J]. IEEE Network,2019,33(6):188-195. [16]王生印 . 协同防空智能目标分配与分布式多约束制导方法研 究[D]. 北京:北京理工大学,2020.