基于多智能体增强学习的WSN能量效率优化路由方法
摘要:
本发明公开了一种基于多智能体增强学习的WSN能量效率优化路由方法,首先对无线传感网络进行预定义,构建路由协作决策系统,包括A个决策网络和1个汇聚模块,A个决策网络分别部署在A个传感器节点的智能体上,汇聚模块部署在汇聚节点上,其中决策网络根据本地观察值向量和位置向量得到概率向量,汇聚模块汇总A个概率向量通过概率采样的方式生成整个无线传感网的路由方案并将其重新部署给传感器;采用多智能体增强学习算法对路由协作决策系统中的A个智能体决策网络进行训练;然后对无线传感网络进行部署,部署完成后周期性地使用路由协作决策系统更新路由方案。本发明对跳数和节点剩余能量进行综合考虑,提高网络存活时间。
0/0