- 专利标题: 一种基于在线强化学习的传输模式选择方法及装置
-
申请号: CN202010187389.0申请日: 2020-03-17
-
公开(公告)号: CN111385894A公开(公告)日: 2020-07-07
- 发明人: 王瑶 , 梁云 , 尹喜阳 , 郭延凯 , 岳顺民 , 田文峰 , 黄凤 , 孙晓艳 , 黄莉 , 黄辉 , 李春龙 , 邓辉
- 申请人: 全球能源互联网研究院有限公司 , 国网天津市电力公司 , 国家电网有限公司
- 申请人地址: 北京市昌平区未来科技城滨河大道18号
- 专利权人: 全球能源互联网研究院有限公司,国网天津市电力公司,国家电网有限公司
- 当前专利权人: 全球能源互联网研究院有限公司,国网天津市电力公司,国家电网有限公司
- 当前专利权人地址: 北京市昌平区未来科技城滨河大道18号
- 代理机构: 北京三聚阳光知识产权代理有限公司
- 代理商 李博洋
- 主分类号: H04W72/04
- IPC分类号: H04W72/04 ; H04L29/08
摘要:
本发明公开了一种基于在线强化学习的传输模式选择方法及装置,其中,该方法包括:获取窄带物联网系统节点的当前时隙状态信息;根据所述当前状态信息利用探索-利用策略执行动作;计算当所述窄带物联网系统节点执行完动作后的奖励值;获取所述窄带物联网系统节点的下一时隙状态信息;根据所述奖励值和所述下一时隙状态信息更新预设Q函数,并更新预设动作策略值,得到第一动作策略值;根据所述第一动作策略值更新预设预估策略值,得到新预估策略值;根据所述新预估策略值和所述第一动作策略值选择传输模式。通过实施本发明,不断对窄带物联网系统节点进行预估比较,使得窄带物联网系统节点可以选择能效最大的传输模式选择方案。
公开/授权文献
- CN111385894B 一种基于在线强化学习的传输模式选择方法及装置 公开/授权日:2022-12-02