行为控制策略的学习方法、装置、设备及存储介质

发明授权

CN110516389B 行为控制策略的学习方法、装置、设备及存储介质有权

请登陆查看更多内容

专利标题： 行为控制策略的学习方法、装置、设备及存储介质
申请号： CN201910820695.0

申请日： 2019-08-29
公开(公告)号： CN110516389B

公开(公告)日： 2021-04-13
发明人: 孙明飞 , 石贝 , 付强
申请人： 腾讯科技(深圳)有限公司
申请人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
专利权人： 腾讯科技(深圳)有限公司
当前专利权人： 腾讯科技(深圳)有限公司
当前专利权人地址： 广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构： 深圳市深佳知识产权代理事务所
代理商 骆苏华
主分类号： G06F30/20
IPC分类号： G06F30/20 ; G06N3/08

摘要：

本申请公开了一种行为控制策略的学习方法、装置、计算机设备及存储介质，该方法包括：从演示行为数据序列中采样出包括至少两个演示行为数据的演示行为数据片段；依据演示行为数据片段，设置物理仿真器中模拟的目标对象的各个关节的初始状态信息，并利用待训练的神经网络模型确定出目标对象的各个关节的作用力数据；控制物理仿真器中模拟的目标对象的各个关节的运动，以使得物理仿真器基于设定的动作行为限定特征，仿真出的目标对象的仿真行为数据序列；依据演示行为数据及仿真行为数据，确定动作行为差异度；基于动作行为差异度，优化神经网络模型直至达到优化目标。本申请的方案有利于演示学习的对象基于演示动作生成扩展后的动作行为。

公开/授权文献

CN110516389A 行为控制策略的学习方法、装置、设备及存储介质公开/授权日：2019-11-29

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F30/00	计算机辅助设计（CAD）
G06F30/20	.设计优化、验证或模拟（电路设计的优化、验证或模拟入G06F30/30）