六、实战验证与对抗指标
1 目标:从动态博弈、对抗演化的层面进行可靠性评价
常用指标体系:
任务成功率(TSR)
某一时间窗内完成全部任务的概率
存活率(SR)
在持续攻击中任务平台或系统生存时间/比例
抵抗干扰指数(RII)
在对抗扰动下保持性能的能力
冗余容错能力(RFC)
多次路径或策略切换后保持任务连续性
指标敏感性(SI)
某一输入指标变化对输出的影响程度
2 模型搭建的主要阶段与算法:
1)状态建模阶段:
1 任务:模拟任务状态、转移规律
2 常用算法:
动态贝叶斯网络(DBN)
马尔科夫链(POMDP)
2)策略学习与路径优化阶段:
1 任务:描述敌我关系、策略演化、任务行为演进,在对抗或扰动条件下做出
最优选择
2 常用算法:
博弈类
Stackellberg 博弈
演化博弈
马尔可夫博弈
深度强化学习类:
DDPG
PPO
Safe-RL
3)对抗扰动生成与风险评估阶段:
1 任务:模拟恶意干扰、极端条件、估计任务失效概率
2 常用算法:
蒙特卡洛仿真
4)模型评估与验证阶段:
1 任务:验证模型预测准确度、可靠性波动、策略稳健性
2 常用算法:
DBN+LS-SVM