-
公开(公告)号:CN118551799A
公开(公告)日:2024-08-27
申请号:CN202410612181.7
申请日:2024-05-16
申请人: 上海大学
IPC分类号: G06N3/008 , G06N3/092 , G06N3/096 , G06N3/0455 , G06N3/0475 , G06N3/094 , G06N3/044
摘要: 本发明公开一种基于离线强化策略学习的安全策略学习方法,涉及强化学习和深度学习领域,该方法包括:获取虚实数据集;基于所述虚实数据集,构建风格迁移模型;将所述虚拟数据输入所述风格迁移模型,生成目标虚拟数据集;融合所述目标虚拟数据与所述真实数据,得到融合数据集;将所述下一时刻融合观测状态输入条件变分自编码器,输出下一时刻的动作;判断所述下一时刻的动作的动作安全值是否小于预设安全阈值;利用更新后的评论家网络更新所述条件变分自编码器,得到更新后的下一时刻的动作,将更新后的下一时刻的动作为安全策略驱动智能体运动。
-
公开(公告)号:CN118520108A
公开(公告)日:2024-08-20
申请号:CN202410572317.6
申请日:2024-05-09
申请人: 上海大学
IPC分类号: G06F16/35 , G06F16/36 , G06F40/242 , G06F40/247 , G06F40/268 , G06F40/284 , G06F40/30 , G06N5/025 , G06N5/02
摘要: 本发明公开一种预测情感衍生行为的方法及装置,涉及情感衍生行为预测技术领域,方法包括:根据三元组关系元数据,利用基于塔克分解的行为预测方法进行第一次学习,得到第一行为概率;基于假想行为构建假想主体‑情感‑行为三元组,并将其嵌入表示融入注意力机制,动态调整主体与情感对假想主体‑情感‑行为三元组的关注度,得到优化假想三元组,以此计算得到第二行为概率;根据第一和第二行为概率确定知识表示模型的最终输出概率。本发明通过注意力机制动态调整主体与情感对假想主体‑情感‑行为三元组的关注度,自我反思对假想上下文语境的依赖程度,完成对隐式情感行为驱动关系的挖掘,实现对情感衍生行为的精确预测。
-
公开(公告)号:CN118365858A
公开(公告)日:2024-07-19
申请号:CN202410517073.1
申请日:2024-04-26
申请人: 上海大学
IPC分类号: G06V10/25 , G06V10/82 , G06V10/80 , G06N3/0985 , G06V10/75 , G06V10/774
摘要: 本发明公开一种海上船舶图像的特征增强及小样本船舶目标识别方法、装置及介质,涉及图像处理领域,特征增强方法包括利用主干网络对海上船舶图像进行多尺度特征提取,获得多个不同尺度的特征;将多个不同尺度的特征进行通道维度和空间维度上的融合,获得多尺度融合特征;采用多头注意力机制对多尺度融合特征进行关系增强,获得关系增强特征;对多尺度融合特征和关系增强特征进行融合,获得增强融合特征。本发明通过对海上船舶图像的多个不同尺度的特征进行通道维度和空间维度上的融合,并采用多头注意力机制对多尺度融合特征进行关系增强,获得增强融合特征,提高了图像的质量和清晰度,增强了图像特征表达能力。
-
公开(公告)号:CN118364815A
公开(公告)日:2024-07-19
申请号:CN202410517129.3
申请日:2024-04-26
申请人: 上海大学
IPC分类号: G06F40/289 , G06N3/045 , G06N3/0499 , G06F40/211 , G06F16/35 , G06F40/30
摘要: 本发明公开一种面向句子全局特征的实体关系抽取方法、系统及介质,涉及实体关系抽取技术领域,包括:获取待抽取实体关系的目标语句;利用预训练的Bert模型对目标语句进行分词编码,得到目标语句嵌入向量;将目标语句嵌入向量输入预训练的全局特征学习网络,得到目标实体关系标注矩阵和目标实体对标注矩阵;全局特征学习网络是基于前馈神经网络和Transformer模型构建的;目标实体关系标注矩阵为标注目标语句中所有实体的类型和关系的矩阵;目标实体对标注矩阵为标注目标语句中所有实体对的矩阵;对目标实体关系标注矩阵和目标实体对标注矩阵解码,得到目标语句对应的三元组形式的实体关系。本发明提高了实体关系抽取的精准性。
-
公开(公告)号:CN118295256A
公开(公告)日:2024-07-05
申请号:CN202410397175.4
申请日:2024-04-02
申请人: 上海大学
IPC分类号: G05B13/04
摘要: 本发明公开基于先验知识和模糊推理的无人系统演示数据集构建方法,涉及模仿学习领域,包括基于先验知识对无人系统的整体任务按步骤进行分解,得到子任务集合;构造有限状态机及每个子任务的模糊规则控制器;将当前时间步的状态向量输入至当前子任务的模糊规则控制器,经模糊规则控制器处理后输出决策输出动作;基于当前时间步的状态向量和决策输出动作,得到当前时间步的状态‑动作对;更新状态向量,重复上述步骤获得多个状态‑动作对,并整合为当前子任务轨迹;将所有子任务轨迹整合得到演示数据轨迹,并存储于演示数据集中。本发明降低了无人系统控制过程中与人类专家交互频率,减少了人类专家参与模型训练的工作量。
-
公开(公告)号:CN116843018A
公开(公告)日:2023-10-03
申请号:CN202310808639.1
申请日:2023-07-03
申请人: 上海大学 , 华东计算技术研究所(中国电子科技集团公司第三十二研究所)
IPC分类号: G06N3/092 , G06N3/0464 , G06F30/27 , G06F111/18
摘要: 本发明公开一种虚实无缝迁移方法、系统、电子设备及介质,涉及表征学习和强化学习领域,该方法包括:获取虚拟环境下智能体与环境的交互数据;对当前状态的观测进行数据增强;将增强后的观测输入孪生表征网络进行降维,得到向量化状态数据;将向量化状态数据和对应的动作输入孪生价值网络,得到对应的价值;根据向量化状态数据、对应的价值和下一状态的观测,构造表征损失函数;根据表征损失函数,应用梯度下降法,对孪生表征网络、孪生价值网络和决策网络进行训练;当总的训练次数大于预设阈值时,得到训练好的表征网络和决策网络,根据真实环境下的当前状态的观测得到响应于真实环境下的动作。本发明能够提高策略的泛化性能。
-
公开(公告)号:CN118626953A
公开(公告)日:2024-09-10
申请号:CN202410675520.6
申请日:2024-05-28
申请人: 上海大学
IPC分类号: G06F18/2415 , G06N3/0442 , G06N3/084 , G06N3/048 , G06F40/30 , G06F18/23213 , G06N3/045
摘要: 本发明公开一种基于语义聚合的群体行为预测方法、产品、介质及设备,涉及群体行为技术领域。所述方法包括:获取实体集合中的上下文信息并计算得上下文表征;对上下文表征进行线性变换后得到上下文表征集合并计算其上下文评分;采用Skip Gram方法获取实体表征;对实体表征进行线性变换后得到实体表征集合并计算其实体评分;基于上下文评分和实体评分得实体‑集合分类器并获得同义实体集合列表;基于同义实体集合列表,得归一化行为序列列表,从而进行群体行为的预测。本发明可基于实体的上下文信息提高语义聚合的准确性,从而有效提高群体行为预测的准确性和效率。
-
公开(公告)号:CN118570780A
公开(公告)日:2024-08-30
申请号:CN202410612319.3
申请日:2024-05-16
申请人: 上海大学
IPC分类号: G06V20/60 , G06V10/82 , G06V10/764 , G06N3/0464 , G06V10/774 , G06V10/44 , G06T7/73
摘要: 本发明公开一种基于多层次特征注意力引导的多源域目标识别方法及系统,涉及多源域目标识别领域,包括:基于原始图像集,利用特征图确定模块提取目标体的特征并进行池化操作,得到每个图像下的多个多层次特征图;基于每个图像的所有多层次特征图,利用尺度特征聚合模块计算注意力权重并聚合多层次多尺度特征,得到每个图像的现实域特征图;基于所有图像的现实域特征图,任意交换两个不同源域的风格特征,得到每个图像的虚拟域特征图;利用特征一致性损失函数计算特征图损失,并以特征图损失最小为目标优化目标体识别模型;将待识别图像输入优化后的目标体识别模型,确定待识别图像中的目标体。本发明提高了真实环境中船舶航行的目标体识别精度。
-
公开(公告)号:CN118569347A
公开(公告)日:2024-08-30
申请号:CN202410613231.3
申请日:2024-05-16
申请人: 上海大学
IPC分类号: G06N3/09 , G06N3/0455 , G06N3/042 , G06N3/0442
摘要: 本发明公开一种基于序列分解的多场景行为序列预测方法、系统、介质及产品,涉及多场景行为序列预测领域,方法包括基于旧场景训练数据和待预测序列得到训练后的基础预测模型和记忆预测模型;基于待预测序列和训练后的基础预测模型得到训练后的基础预测模型的第一预测标签;基于待预测序列、训练后的基础预测模型和训练后的记忆预测模型得到训练后的记忆预测模型的第二预测标签;基于训练后的基础预测模型的第一预测标签和训练后的记忆预测模型的第二预测标签得到待预测序列的邻接节点集合,本发明能够克服由时间推移、场景变化等因素引起的概念漂移现象造成模型对多场景中的行为序列进行预测时性能下降的问题。
-
公开(公告)号:CN118034056A
公开(公告)日:2024-05-14
申请号:CN202410279253.0
申请日:2024-03-12
申请人: 上海大学 , 华东计算技术研究所(中国电子科技集团公司第三十二研究所)
IPC分类号: G05B13/04
摘要: 本发明公开一种基于近分布采样和自适应探索的仿生机器人稳定策略调优方法、系统及产品,涉及强化学习领域,方法包括获取仿生机器人的预训练的策略网络;仿生机器人与环境交互得到在线数据集;基于在线数据集和训练后的行为模型构建当前训练数据集;基于当前训练数据集对预训练的策略网络进行迭代更新,得到更新后的策略网络;根据更新后的策略网络对仿生机器人的动作进行控制,本发明可解决离线数据集与在线样本之间分布漂移问题,以提升离线智能体在策略调优时的稳定性。
-
-
-
-
-
-
-
-
-