-
公开(公告)号:CN119250156B
公开(公告)日:2025-03-21
申请号:CN202411758866.9
申请日:2024-12-03
Applicant: 中国科学院自动化研究所
IPC: G06N3/092 , G06N3/0455 , G06N3/0985 , G06F18/22
Abstract: 本发明提供一种离线元强化学习模型训练方法、装置、设备、介质及产品,涉及人工智能技术领域,方法包括:基于不同训练任务之间的相似度对上下文编码器进行训练,以最小化相似度高于阈值的训练任务的表示向量之间的距离,最大化相似度低于阈值的训练任务的表示向量之间的距离;基于保守Q学习对Q函数网络进行训练,以最小化标准贝尔曼误差,和最小化训练策略对应的Q值与行为策略对应的Q值之间的差距;基于行为正则化演员评判家对策略网络进行训练,以限制训练策略与行为策略之间的差异;根据训练好的上下文编码器、Q函数网络和策略网络,得到训练好的离线元强化学习模型。本发明实现增强离线元强化学习模型的性能表现、鲁棒性和泛化能力。
-
公开(公告)号:CN119250156A
公开(公告)日:2025-01-03
申请号:CN202411758866.9
申请日:2024-12-03
Applicant: 中国科学院自动化研究所
IPC: G06N3/092 , G06N3/0455 , G06N3/0985 , G06F18/22
Abstract: 本发明提供一种离线元强化学习模型训练方法、装置、设备、介质及产品,涉及人工智能技术领域,方法包括:基于不同训练任务之间的相似度对上下文编码器进行训练,以最小化相似度高于阈值的训练任务的表示向量之间的距离,最大化相似度低于阈值的训练任务的表示向量之间的距离;基于保守Q学习对Q函数网络进行训练,以最小化标准贝尔曼误差,和最小化训练策略对应的Q值与行为策略对应的Q值之间的差距;基于行为正则化演员评判家对策略网络进行训练,以限制训练策略与行为策略之间的差异;根据训练好的上下文编码器、Q函数网络和策略网络,得到训练好的离线元强化学习模型。本发明实现增强离线元强化学习模型的性能表现、鲁棒性和泛化能力。
-
公开(公告)号:CN114330321B
公开(公告)日:2025-01-03
申请号:CN202111666897.8
申请日:2021-12-31
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC: G06F40/279 , G06N5/02 , G06N3/042 , G06N3/08 , G06N3/0442 , G06F18/22
Abstract: 本发明公开了一种用户先验知识增强的文本风格迁移方法、装置及电子设备,所述方法包括:获取用户先验知识数据,并基于所述用户先验知识数据构建预设神经网络模型;获取用户输入数据,并将所述用户输入数据映射至所述预设神经网络模型中,生成与所述用户输入数据的表达方式不同的目标文本内容表示;获取用户关注领域表示,并结合所述目标文本内容表示和用户关注领域表示,生成目标文本内容。本发明不仅可以实现文本风格的转换,还提升了转换文本内容与用户要求的相关性。
-
公开(公告)号:CN118471545B
公开(公告)日:2024-11-19
申请号:CN202410927599.7
申请日:2024-07-11
Applicant: 中国科学院自动化研究所
IPC: G16H50/80 , G16H50/70 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/084 , G06F18/213 , G06F18/25 , G06N3/0442
Abstract: 本发明提供一种基于数据解耦的传染病传播预测方法、装置及电子设备,涉及医疗保健信息学技术领域,方法包括:获取待预测传染病数据并进行编码,得到传染病编码数据;对传染病编码数据进行数据解耦,分别得到风险外溢信号数据和本地演变信号数据;通过图卷积神经网络对风险外溢信号数据进行特征提取,得到风险外溢特征,并通过长短期记忆网络对本地演变信号数据进行特征提取,得到本地演变特征;将风险外溢特征与本地演变特征进行特征融合,得到传染病数据融合特征,并通过多层感知机对传染病数据融合特征进行预测得到传播预测结果。通过本申请,在预测时结合传染病传播性质和演变规律,来提取特征进行传染病传播预测,提高了预测准确性。
-
公开(公告)号:CN118607532A
公开(公告)日:2024-09-06
申请号:CN202410691440.X
申请日:2024-05-30
Applicant: 中国科学院自动化研究所
IPC: G06F40/30 , G06F40/279 , G06F18/214
Abstract: 本申请提供一种基于词表扩充的语种间语义对齐方法、装置及电子设备。该方法包括:从目标语言的语料中提取所述目标语言的token;将目标语言的token作为扩充token对原语言模型进行词表扩充;通过微调词表扩充后的原语言模型将所述扩充token嵌入到预训练语言的语义空间中。本申请提供的基于词表扩充的语种间语义对齐方法、装置及电子设备,将目标语言以新添加的token形式嵌入到预训练语言的语义空间中,增强模型处理多语言任务的能力的同时,提升了模型对目标语言的文本理解和生成能力。
-
公开(公告)号:CN116306649A
公开(公告)日:2023-06-23
申请号:CN202310181570.4
申请日:2023-02-20
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/284 , G06F40/242
Abstract: 本发明提供一种词向量的生成方法、装置、电子设备及存储介质,该方法包括:获取至少一个目标词,所述目标词包括所述词典中的至少一个第一词汇,和/或,所述知识库中的至少一个头实体,所述知识库中包括至少两个用于表示知识的三元组数据;确定各所述目标词对应的至少一个释义词,所述释义词包括用于解释所述第一词汇的第二词汇,和/或,所述头实体对应的关系和尾实体;基于所述目标词和所述释义词,确定词向量矩阵,所述词向量矩阵的每一行表示一个词向量,所述词向量用于表征所述目标词或所述释义词的语义信息。本发明提供的词向量的生成方法、装置、电子设备及存储介质可以增强词向量的可解释性。
-
公开(公告)号:CN115238068A
公开(公告)日:2022-10-25
申请号:CN202210709135.X
申请日:2022-06-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种语音转录文本聚类方法、装置、电子设备和存储介质,所述方法包括:提取各语音转录文本的向量表示;将各语音转录文本的向量表示输入至文本聚类模型,得到文本聚类模型输出的各语音转录文本的聚类结果;本发明以最小化相同样本语音转录文本的向量表示之间的距离,最大化不同样本语音转录文本的向量表示之间的距离,最小化样本语音转录文本的向量表示与其所属类别的语义向量之间的距离以及最大化样本语音转录文本的向量表示与其它类别的语义向量之间的距离为目标迭代更新训练得到文本聚类模型,最终使得文本聚类模型能够从文本层面和类别层面对各语音转录文本进行聚类,进而准确得到聚类结果。
-
公开(公告)号:CN114818733A
公开(公告)日:2022-07-29
申请号:CN202210555613.6
申请日:2022-05-20
Applicant: 中国科学院自动化研究所
IPC: G06F40/30 , G06F40/253 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种媒体转引类型的识别方法、装置、电子设备及存储介质,属于自然语言处理领域。其中,该方法包括:将源媒体发布的源信息和转引媒体发布的转引信息输入预训练语言模型,分别得到源信息和转引信息的篇章表示向量以及句子表示向量;对源信息和转引信息的各句子表示向量进行双向交互式语义信息学习,得到双向的交互语义篇章表示向量;将基于预训练语言模型得到篇章表示向量和交互语义篇章表示向量进行融合,得到增强语义表示向量;根据所述增强语义表示向量进行媒体转引类型识别,得到媒体转引类型。通过本发明,实现了多层级、细粒度地增强篇章的语义表征能力,有效提升媒体转引类型的识别性能。
-
公开(公告)号:CN108763319B
公开(公告)日:2022-02-08
申请号:CN201810396753.7
申请日:2018-04-28
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06N3/04 , G06Q50/00
Abstract: 本发明属于计算机技术领域,具体提供了一种融合用户行为和文本信息的社交机器人检测方法和系统。旨在解决现有技术手动选取特征、忽略社交媒体帖子之间的逻辑性和时序性以及忽略社交平台用户行为信息的问题,本发明的社交机器人的检测方法包括获取待检测社交媒体用户的历史网络数据和好友网络数据;基于上述数据得到用户文本特征向量、行为特征向量以及好友网络特征向量,并将其融合,得到待检测社交媒体用户的用户特征向量;对用户特征向量进行检测,输出检测结果。本发明的方法更加符合社交媒体自身的特性,从多个维度分析待检测社交媒体用户,提升了检测准确率。本发明的系统同样具有上述有益效果。
-
公开(公告)号:CN109800431A
公开(公告)日:2019-05-24
申请号:CN201910062802.8
申请日:2019-01-23
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于计算机科学技术领域,尤其是涉及一种事件信息关键词提取方法、监控方法、及其系统和装置,旨在为了解决解决无监督方法提取关键词效果不稳定的问题。本发明提取方法对于获取的待监控的事件信息,基于多种关键词提取技术提取并优选一组相关性很强的关键词作为第一关键词组,而后基于关键词在时域的发展演化选出最新的热点词汇作为第二关键词组,再后对同一时间段内的同一事件的不同报道进行聚类,提取各聚类的关键词合并后作为第三关键字组,最后合并三个关键词组并选定最终的关键词组合。本发明提高了系统的稳定性,同时兼顾了时域及同一事件不同侧面的发展方向。
-
-
-
-
-
-
-
-
-