一种基于知识增强的连续学习软标签构建方法

    公开(公告)号:CN117743858A

    公开(公告)日:2024-03-22

    申请号:CN202410183536.5

    申请日:2024-02-19

    摘要: 本发明涉及人工智能技术领域,提供了一种基于知识增强的连续学习软标签构建方法,该方法包括:随机初始化语义软标签,计算语义Gram矩阵,通过语义Gram矩阵、词向量Gram矩阵和相应类别平滑后的语义软标签,获得优化后的语义软标签损失函数;随机初始化知识蒸馏软标签,计算知识蒸馏Gram矩阵,通过知识蒸馏Gram矩阵、嵌入Gram矩阵和相应类别平滑后的知识蒸馏软标签,获得优化后的知识蒸馏软标签损失函数;将上述两种损失函数结合,获得总损失函数;将所述总损失函数用于新任务的训练。本发明解决了在神经网络模型连续学习过程中缺乏旧任务数据的问题,避免了灾难性遗忘的效果。

    一种基于子空间感知的多智能体探索方法和设备

    公开(公告)号:CN117065354A

    公开(公告)日:2023-11-17

    申请号:CN202310981366.0

    申请日:2023-08-04

    IPC分类号: A63F13/67

    摘要: 本发明提供一种基于子空间感知的多智能体探索方法和设备,该方法包括:获取多智能体与游戏仿真环境交互得到的多组仿真数据;从多组仿真数据中选取至少一组目标仿真数据,并确定每一组目标仿真数据中多智能体的输出动作分别对应不同维度的状态子空间的团队奖励;基于任意一组目标仿真数据中多智能体的输出动作分别对应不同维度的状态子空间的团队奖励,更新任意一组目标仿真数据中多智能体的输出动作对应的初始团队奖励;在各组目标仿真数据中多智能体的输出动作对应的初始团队奖励更新完成后,基于更新后的至少一组目标仿真数据,更新多智能体的参数,使得智能体的探索方向可以被控制,提高了多智能体的探索效率。

    多智能体信用分配方法、装置、可读存储介质和智能体

    公开(公告)号:CN115660110B

    公开(公告)日:2023-04-14

    申请号:CN202211672682.1

    申请日:2022-12-26

    IPC分类号: G06N20/00

    摘要: 本发明提供了一种多智能体信用分配方法、装置、可读存储介质和智能体,涉及强化学习、多智能体技术领域。该方法包括:定义信用分配智能体在预设环境中的信用分配策略空间;使信用分配智能体学习一个信用分配策略,使信用分配智能体在训练时按照信用分配策略探索信用分配策略空间,并基于全局状态信息输出动作;从动作得到目标动作,并将目标动作作为多智能体协同的信用分配策略。该方法从形式上定义了信用分配策略空间,并基于值分解框架提出了随机化信用分配方法,在训练时基于可学习的策略分布,能够以一定概率采样出一个信用分配策略,最终实现了对信用分配策略空间的有效探索,得到更好的信用分配策略,增强算法在多智能体合作任务上的能力。

    多智能体的价值评估方法、装置和可读储存介质

    公开(公告)号:CN115618754B

    公开(公告)日:2023-04-07

    申请号:CN202211631819.9

    申请日:2022-12-19

    IPC分类号: G06F30/27 G06N3/04 G06N3/08

    摘要: 本发明提供了一种多智能体的价值评估方法、装置和可读储存介质,涉人工智能技术领域,旨在解决针对多智能体,价值评估模块进行价值评估过程中,忽略了联合动作的作用,导致价值评估模块的价值评估在联合行动空间上的泛化性较差的技术问题,本发明提供的多智能体的价值评估方法以互信息最大化的方法来更新联合动作映射模型中的映射函数,使得联合动作映射与状态转移向量之间的互信息最大化,即使得联合动作映射的映射向量中蕴含丰富的状态转移信息,也即在通过价值评估模块进行价值评估之前,能够知道联合动作的各种结果信息,这样提前知道联合动作的结果又能够使得价值评估模块的评估结果更加准确。

    一种支持图灵测试模式的人机对抗系统及智能体测试方法

    公开(公告)号:CN114154611B

    公开(公告)日:2022-12-06

    申请号:CN202111328333.3

    申请日:2021-11-10

    摘要: 本发明提供一种支持图灵测试模式的人机对抗系统及智能体测试方法,所述系统包括:人机对抗模块,用于完成人机对抗;其中,通过人类对抗者和智能体在双盲环境下完成人机对抗;对抗数据采集模块,用于获取人机对抗结果以及人机对抗的复盘对抗数据;对抗数据分析模块,用于根据复盘对抗数据获取智能体的效能数据;图灵问卷模块,用于通过图灵问卷的形式,采集智能体的外界评价信息;对抗成绩管理模块,用于接收并存储人机对抗结果、智能体的外界评价信息和智能体的效能数据,并根据人机对抗结果、智能体的外界评价信息和智能体的效能数据获取智能体的能力测试结果。本发明实现了对智能体决策能力的全面有效地测试。

    一种箱庭游戏的智能心理描述系统

    公开(公告)号:CN115222008A

    公开(公告)日:2022-10-21

    申请号:CN202110401993.3

    申请日:2021-04-14

    摘要: 本发明提供通用的一种箱庭游戏的智能心理描述系统,包括:由训练好的图像特征提取单元对箱庭游戏图像进行特征提取,得到所述箱庭游戏图像中的沙具;将沙具作为实体,将实体和实体间的关系输入到所述图像特征提取单元,得到箱庭游戏图像场景图和实体间的距离矩阵;对箱庭游戏图像场景图中的节点进行特征表示和向量表征,得到节点特征向量;将节点特征向量嵌入到箱庭游戏图像场景图中,得到特征向量嵌入场景图;特征向量嵌入场景图和所述实体间的距离矩阵构成空间向量特征;将节点特征向量和空间向量特征输入到编码器再到解码器,得到解码特征向量;将解码特征向量输入到图像描述单元得到箱庭游戏图像的描述报告。

    基于凸壳扫描的图像物体对称性识别方法、系统及设备

    公开(公告)号:CN114119721B

    公开(公告)日:2022-04-01

    申请号:CN202210084200.4

    申请日:2022-01-25

    IPC分类号: G06T7/68 G06T7/13

    摘要: 本发明属于计算机视觉和图像对称性识别领域,具体涉及了一种基于凸壳扫描的图像物体对称性识别方法、系统及设备,旨在解决现有技术在存在少量不对称元素时难以识别物体整体对称性的问题。本发明包括:对于图像中的每类物体进行检测与定位,并进行点集分类;对于每一类点集,通过基于Graham扫描法生成点集对应的凸壳;以凸壳中的每一条边中垂线与角平分线作为潜在对称轴;若存在任一对称轴,使得点集中关于该轴对称的点在点集中的占比大于设定对称性阈值,则该点集对应的物体具有对称性。本发明以简单高效的方式实现了场景图像中物体对称现象的识别,能够较好地应对存在噪声点(不完全对称)的情况,鲁棒性好。

    基于莫兰指数的视觉场景混乱程度判别方法、系统、设备

    公开(公告)号:CN114037025B

    公开(公告)日:2022-03-25

    申请号:CN202210021379.9

    申请日:2022-01-10

    IPC分类号: G06K9/62 G06F30/20

    摘要: 本发明属于心理沙盘图像分析领域,具体涉及一种基于莫兰指数的视觉场景混乱程度判别方法、系统、设备,旨在解决现有技术无法刻画相关物体在空间上是否相近,导致在离散分布的视觉场景中混乱程度判别能力较差的问题。本发明方法包括:采集来访者制作的沙盘作品对应的沙盘作品数据,作为输入数据;根据输入数据中沙具在心理沙盘上的坐标,对心理沙盘上的沙具进行聚类;通过全局莫兰指数对聚类后不同类簇内的沙具进行空间自相关计算;得到来访者制作的沙盘作品中沙具摆放的混乱程度。本发明提升了离散分布的视觉场景中混乱程度判别能力。

    视觉场景中物体稀疏性的判断方法、系统和设备

    公开(公告)号:CN114004877A

    公开(公告)日:2022-02-01

    申请号:CN202111651670.6

    申请日:2021-12-31

    摘要: 本发明属于图像分析领域,具体涉及了一种视觉场景中物体稀疏性的判断方法、系统和设备,旨在解决现有的沙盘游戏通常利用经验来判断沙盘作品的稀疏性,具有很大的主观性,不同分析师给出的结果会有一定的偏差的问题。本发明包括:获取视觉场景图像,对所述视觉场景图像中的物体目标进行聚类,获得多个聚类簇,提取每个聚类簇中的凸包络,计算凸包络的面积,计算所有所述凸包络的面积之和与视觉场景图像面积的比值r,预设物体稀疏性判断区间,当所述比值r处于对应的稀疏性判断区间时,获得视觉场景图像的稀疏性。本发明能够准确判断物体目标的稀疏性,能够避免沙盘分析师的主观经验影响,提高沙盘分析对空洞主题识别的准确性和一致性。

    一种人机对抗能力评估评测方法和系统

    公开(公告)号:CN113902355A

    公开(公告)日:2022-01-07

    申请号:CN202111482468.5

    申请日:2021-12-07

    IPC分类号: G06Q10/06 G06N20/00

    摘要: 本发明提出一种人机对抗能力评估评测方法和系统。其中,方法包括:根据对手信息和初始环境信息,构建评测对象的人机对抗能力模型;根据人机对抗能力模型生成人机对抗能力分级对抗环境;设置评测对象的各个能力等级评估评测的通过指标;根据所述通过指标,计算评测对象能力等级。本发明公开的上述方法围绕人机对抗的三要素,即“人”(对手识别)要素、“机”(行为建模)要素和“物”(空间认知)要素构建能力表征模型,形成了形式化的能力评估评测方法,为智能体能力发展方向提供了任务环境生成依据。