智能体的训练方法、交互方法及相应系统

    公开(公告)号:CN118051780B

    公开(公告)日:2024-07-16

    申请号:CN202410444184.4

    申请日:2024-04-12

    发明人: 倪晚成 赵晓楠

    IPC分类号: G06F18/214 G06N3/006

    摘要: 本公开提供了一种智能体的训练方法、交互方法及相应系统。适用于人机交互场景的智能体的训练方法包括:从所述智能体的策略空间采样多个策略作为本轮训练的测试策略;在人机交互任务环境中对各测试策略进行测试,得到所述各测试策略在m个测试任务上的测试结果;基于所述测试结果,计算用于评估所述各测试策略在各测试任务中的表现的客观评估数据;向用户输出所述测试结果,并接收所述用户对所述各测试策略在所述各测试任务中的表现的主观评估数据;基于所述客观评估数据和所述主观评估数据,更新所述智能体。根据本公开的示例性实施例,综合考虑人类的主观感受和智能体的客观能力完成智能体评估及训练,使训练得到的智能体能力强且被人类认可。

    兵棋智能体的训练方法、预测方法及相应系统

    公开(公告)号:CN118045360A

    公开(公告)日:2024-05-17

    申请号:CN202410302417.7

    申请日:2024-03-15

    摘要: 本公开提供了一种兵棋智能体的训练方法、预测方法及相应系统。所述兵棋智能体的训练方法包括:基于兵棋对抗环境,生成专家示范数据集;基于所述专家示范数据集,对所述兵棋智能体中的用于为我方各算子选择机动方位的多任务网络进行模仿学习训练,以得到初步训练好的多任务网络;基于所述兵棋对抗环境,对初步训练好的多任务网络进行强化学习训练,得到优化后的多任务网络;其中,所述专家示范数据集包括:所述多任务网络决策所需的态势特征、我方的N个算子的机动方位标签,N为大于1的整数。根据本公开,能够实现具有更高性能的兵棋智能体的高效获取。

    兵棋数据的标注方法、系统、存储介质和电子设备

    公开(公告)号:CN117892823A

    公开(公告)日:2024-04-16

    申请号:CN202311830060.1

    申请日:2023-12-27

    摘要: 本发明涉及一种兵棋数据的标注方法、系统、存储介质和电子设备,包括:获取推演战报数据中记录的意图描述信息,基于意图描述信息进行标签标注;采集实时推演数据以及语音数据,基于标签识别策略,对语音数据进行标签标注;获取标签对应的语音数据的起始时间及结束时间,基于起始时间至结束时间之间的语音数据,获取该语音数据对应的实时推演数据中的起始帧及结束帧,将起始帧及结束帧之间的实时推演数据标注为该标签;回放标注的实时推演数据,接收依据回放的标注的实时推演数据及在回放的界面展示的标签识别策略输入的标签信息,对标注的实时推演数据进行再标注。可以提升标签的标注效率及标注准确度。

    支持心理临场感操控的人机博弈系统和人机博弈方法

    公开(公告)号:CN115933889B

    公开(公告)日:2023-11-03

    申请号:CN202310183032.9

    申请日:2023-03-01

    IPC分类号: G06F3/01 G16H20/70

    摘要: 本申请实施例涉及一种支持心理临场感操控的人机博弈系统和人机博弈方法,涉及人机博弈领域。该系统包括:人机博弈模块,用于实现人机博弈;行为数据采集模块,用于获取人类对抗者在博弈中的第一动作生理数据和博弈行为数据;行为数据处理模块,用于基于博弈行为数据库确定与所述第一动作生理数据和博弈行为数据相对应的人类对抗者的第一心理状态;心理操控知识库模块,用于基于心理操控知识库确定与所述第一心理状态和心理操控目的相对应的第一心理操控方案;心理操控干预模块,用于执行所述第一心理操控方案,该系统能够观测博弈者心理状态,并对博弈者实施心理操纵与干预,构建更逼近真实的博弈环境。

    一种博弈对抗数据的处理方法及装置、设备及存储介质

    公开(公告)号:CN115952867B

    公开(公告)日:2023-06-02

    申请号:CN202310229903.6

    申请日:2023-03-10

    IPC分类号: G06N5/04 G06F40/30

    摘要: 本公开涉及一种博弈对抗数据的处理方法及装置、设备及存储介质,所述方法包括:对于所获取博弈对抗数据中的每一个对抗实体,根据所述博弈对抗数据,生成与当前对抗实体对应的时间连续的动作序列;将所述动作序列分割为多个动作子序列;确定每一个动作子序列对应的第一行为语义,并基于多个动作子序列各自对应的第一行为语义,得到当前对抗实体对应的时间连续的第一行为序列;根据多个对抗实体各自对应的第一行为序列,生成多个第二行为语义;最终根据对抗实体的动作序列、第一行为序列和第二行为序列生成博弈对抗文本。从原始博弈对抗数据生成博弈对抗文本的过程,不仅实现对整个博弈过程的自动认知理解,而且也实现对博弈对抗数据的语义标注。

    人机智能博弈系统
    56.
    发明公开

    公开(公告)号:CN113633994A

    公开(公告)日:2021-11-12

    申请号:CN202110808844.9

    申请日:2021-07-16

    摘要: 本发明提供一种人机智能博弈系统,所述系统包括:推演方决策模块,用于基于智能体框架模块传入的态势信息,确定动作集合;智能体框架模块,用于将推演房间模块发送的态势信息传入推演方决策模块,以使推演方决策模块生成动作集合,并将动作集合发送至推演房间模块;推演房间模块,用于将动作集合传入推演环境模块,以获取推演环境模块基于动作集合推演得到的态势信息,并将态势信息发送至智能体框架模块。本发明实现了对抗策略生成和智能体运行业务逻辑的解耦,使第三方开发者能够专注于博弈策略研发,同时符合标准的智能体能方便快捷地进行人机、机机对抗,实现了异构智能体的开放接入,显著减少整体故障概率,具有较好的鲁棒性。

    一种可用于非特定人的双目视觉图像合成装置与方法

    公开(公告)号:CN105893965B

    公开(公告)日:2019-03-29

    申请号:CN201610197497.X

    申请日:2016-03-31

    IPC分类号: G06K9/00

    摘要: 本发明提供一种可用于非特定人的双目视觉图像合成装置与方法,所述装置包括双目视觉采集模块、相机姿态调整模块、控制模块、人脸识别模块、人脸对齐模块、存储模块及图像合成模块,其中人脸识别模块捕获双目视觉采集模块所采集图像中的人脸信息,控制模块根据人脸在图像中的位置驱动相机姿态调整模块跟踪人脸,稳定后拍摄立体人脸图像,并将对齐后的立体人脸图像保存到存储模块中,最后通过图像合成模块将同一使用者在不同时间拍摄的立体人脸图像按时间顺序连续播放。本发明使用双目摄像头拍摄立体人脸图像,通过长时间多次拍摄实现自动记录一个或多个使用者不同时期的面部图像,可用于个性化的成长记录或个人档案。

    陆军战术兵棋博弈中坦克战术行为模拟方法及系统和设备

    公开(公告)号:CN108647374A

    公开(公告)日:2018-10-12

    申请号:CN201810238441.3

    申请日:2018-03-22

    IPC分类号: G06F17/50

    摘要: 本发明涉及陆军战术兵棋博弈领域,具体涉及一种陆军战术兵棋博弈中坦克战术行为模拟方法及系统和设备,旨在提高模拟系统在复杂多变环境下的速度。本发明的坦克战术行为模拟方法包括:接收我方棋子位置、敌方棋子位置,以及棋子在战场任意位置点的攻击区域、被攻击区域和机动区域等当前的态势信息;根据当前的态势信息确定模拟系统中我方坦克的初始位置并选择初始攻击目标;根据初始攻击目标将我方坦克机动到攻击位置;选择我方坦克在当前位置的攻击目标;对当前位置的攻击目标进行射击;计算当前位置点对应的撤退位置;将我方坦克撤退到当前位置点对应的撤退位置。使坦克能够在复杂、高动态及不确定的博弈回合内快速、合理地执行战术行为动作。

    一种基于词典的语义知识库的构建方法

    公开(公告)号:CN104484411B

    公开(公告)日:2017-12-22

    申请号:CN201410783884.2

    申请日:2014-12-16

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种基于词典的语义知识库的构建方法,包括:构建基于词典语义知识表示模型的知识数据库;根据语义知识提取规则提取义项释义的语义知识;实现提取语义知识的义项映射;提取义项剩余释义的语义知识。本发明的方法能够灵活、快速地从词典中构建包含丰富语义的知识库,且知识库中所表示的知识具有通用性和权威性。本发明同时为自然语言的语义信息处理提供了一种深层语义知识的表示方法和语义相似度的计算方法,在自然语言处理领域具有广泛的应用价值,如在信息检索领域,能够实现基于语义而非关键词的检索,从而得到更贴近用户需求的深层语义检索结果。

    一种悬浮式投影交互系统
    60.
    发明公开

    公开(公告)号:CN105867702A

    公开(公告)日:2016-08-17

    申请号:CN201610179114.6

    申请日:2016-03-25

    IPC分类号: G06F3/042 G03B21/00

    CPC分类号: G06F3/0425 G03B21/008

    摘要: 本发明公开了一种悬浮式投影交互系统,由磁悬浮控制底座部分和悬浮交互投影部分两个组件构成,两个组件又分为磁悬浮模块、无线充电模块、交互触控模块、微型投影模块和核心控制板模块五个子系统。所述磁悬浮控制底座部分主要用于悬浮起上方悬浮交互投影部分,并为其无线传输电能,悬浮交互投影部分主要用于多角度投影、网络通信和实现触控交互功能。本发明可有效解决当前微型投影易受振动影响,造成投影画面抖动、镜头无法自动调焦、投影区域无法自动梯形校正等问题,同时利用线性激光、摄像头和微型投影为使用者提供投影交互操作手段,从而呈现出一种全新的悬浮投影交互体验方式,让投影摆脱外界干扰,开辟悬浮微型投影交互市场应用新思路。