发明公开
摘要:
本发明公开了一种应用于认知雷达的抗干扰决策方法,包括:获取环境状态信息,包括:当前时刻的外在干扰信息及各历史时刻的抗干扰动作;将环境状态信息作为马尔科夫决策过程<S,A,P,R,γ>中状态S={Jt,A1,A2,...,At‑1}的初始值,基于强化学习算法执行马尔科夫决策,直至行为价值矩阵收敛;根据收敛的行为价值矩阵,利用标准贪婪算法选择认知雷达的下一抗干扰动作;其中,P表示状态转移概率,A表示抗干扰动作,R表示抗干扰收益,γ表示时间折扣因子。本发明可使认知雷可以从复杂的抗干扰措施中选择合适的抗干扰措施,而不受攻击者类型的限制。
公开/授权文献
- CN113866723B 一种应用于认知雷达的抗干扰决策方法 公开/授权日:2024-07-16