Patent search ap:("中国科学院自动化研究所") AND inv:"曾大军" Page 1

1.

发明授权
离线元强化学习模型训练方法、装置、设备、介质及产品有权

公开(公告)号：CN119250156B

公开(公告)日：2025-03-21

申请号：CN202411758866.9

申请日：2024-12-03

Applicant: 中国科学院自动化研究所

Inventor： 李浩锐 , 梁嘉琦 , 李林静 , 白洁 , 曾大军

IPC: G06N3/092 , G06N3/0455 , G06N3/0985 , G06F18/22

Abstract: 本发明提供一种离线元强化学习模型训练方法、装置、设备、介质及产品，涉及人工智能技术领域，方法包括：基于不同训练任务之间的相似度对上下文编码器进行训练，以最小化相似度高于阈值的训练任务的表示向量之间的距离，最大化相似度低于阈值的训练任务的表示向量之间的距离；基于保守Q学习对Q函数网络进行训练，以最小化标准贝尔曼误差，和最小化训练策略对应的Q值与行为策略对应的Q值之间的差距；基于行为正则化演员评判家对策略网络进行训练，以限制训练策略与行为策略之间的差异；根据训练好的上下文编码器、Q函数网络和策略网络，得到训练好的离线元强化学习模型。本发明实现增强离线元强化学习模型的性能表现、鲁棒性和泛化能力。

2.

发明公开
离线元强化学习模型训练方法、装置、设备、介质及产品有权

公开(公告)号：CN119250156A

公开(公告)日：2025-01-03

申请号：CN202411758866.9

申请日：2024-12-03

Applicant: 中国科学院自动化研究所

Inventor： 李浩锐 , 梁嘉琦 , 李林静 , 白洁 , 曾大军

IPC: G06N3/092 , G06N3/0455 , G06N3/0985 , G06F18/22

Abstract: 本发明提供一种离线元强化学习模型训练方法、装置、设备、介质及产品，涉及人工智能技术领域，方法包括：基于不同训练任务之间的相似度对上下文编码器进行训练，以最小化相似度高于阈值的训练任务的表示向量之间的距离，最大化相似度低于阈值的训练任务的表示向量之间的距离；基于保守Q学习对Q函数网络进行训练，以最小化标准贝尔曼误差，和最小化训练策略对应的Q值与行为策略对应的Q值之间的差距；基于行为正则化演员评判家对策略网络进行训练，以限制训练策略与行为策略之间的差异；根据训练好的上下文编码器、Q函数网络和策略网络，得到训练好的离线元强化学习模型。本发明实现增强离线元强化学习模型的性能表现、鲁棒性和泛化能力。

3.

发明授权
用户先验知识增强的文本风格迁移方法、装置及电子设备有权

公开(公告)号：CN114330321B

公开(公告)日：2025-01-03

申请号：CN202111666897.8

申请日：2021-12-31

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所

Inventor： 刘春阳 , 解峥 , 张旭 , 李秋丹 , 陈丽萍 , 彭鑫 , 曾大军

IPC: G06F40/279 , G06N5/02 , G06N3/042 , G06N3/08 , G06N3/0442 , G06F18/22

Abstract: 本发明公开了一种用户先验知识增强的文本风格迁移方法、装置及电子设备，所述方法包括：获取用户先验知识数据，并基于所述用户先验知识数据构建预设神经网络模型；获取用户输入数据，并将所述用户输入数据映射至所述预设神经网络模型中，生成与所述用户输入数据的表达方式不同的目标文本内容表示；获取用户关注领域表示，并结合所述目标文本内容表示和用户关注领域表示，生成目标文本内容。本发明不仅可以实现文本风格的转换，还提升了转换文本内容与用户要求的相关性。

4.

发明授权
基于数据解耦的传染病传播预测方法、装置及电子设备有权

公开(公告)号：CN118471545B

公开(公告)日：2024-11-19

申请号：CN202410927599.7

申请日：2024-07-11

Applicant: 中国科学院自动化研究所

Inventor： 曹志冬 , 费佳强 , 罗天怡 , 王姣姣 , 曾大军 , 于春淼 , 张翔宇

IPC: G16H50/80 , G16H50/70 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/084 , G06F18/213 , G06F18/25 , G06N3/0442

Abstract: 本发明提供一种基于数据解耦的传染病传播预测方法、装置及电子设备，涉及医疗保健信息学技术领域，方法包括：获取待预测传染病数据并进行编码，得到传染病编码数据；对传染病编码数据进行数据解耦，分别得到风险外溢信号数据和本地演变信号数据；通过图卷积神经网络对风险外溢信号数据进行特征提取，得到风险外溢特征，并通过长短期记忆网络对本地演变信号数据进行特征提取，得到本地演变特征；将风险外溢特征与本地演变特征进行特征融合，得到传染病数据融合特征，并通过多层感知机对传染病数据融合特征进行预测得到传播预测结果。通过本申请，在预测时结合传染病传播性质和演变规律，来提取特征进行传染病传播预测，提高了预测准确性。

5.

发明公开
基于词表扩充的语种间语义对齐方法、装置及电子设备审中-实审

公开(公告)号：CN118607532A

公开(公告)日：2024-09-06

申请号：CN202410691440.X

申请日：2024-05-30

Applicant: 中国科学院自动化研究所

Inventor： 张兴伟 , 黄海涛 , 吴杨 , 白松冉 , 郑晓龙 , 曾大军

IPC: G06F40/30 , G06F40/279 , G06F18/214

Abstract: 本申请提供一种基于词表扩充的语种间语义对齐方法、装置及电子设备。该方法包括：从目标语言的语料中提取所述目标语言的token；将目标语言的token作为扩充token对原语言模型进行词表扩充；通过微调词表扩充后的原语言模型将所述扩充token嵌入到预训练语言的语义空间中。本申请提供的基于词表扩充的语种间语义对齐方法、装置及电子设备，将目标语言以新添加的token形式嵌入到预训练语言的语义空间中，增强模型处理多语言任务的能力的同时，提升了模型对目标语言的文本理解和生成能力。

6.

发明公开
词向量的生成方法、装置、电子设备及存储介质有权

公开(公告)号：CN116306649A

公开(公告)日：2023-06-23

申请号：CN202310181570.4

申请日：2023-02-20

Applicant: 中国科学院自动化研究所

Inventor： 何赛克 , 张立业 , 张培杰 , 张玮光 , 曾大军

IPC: G06F40/295 , G06F40/284 , G06F40/242

Abstract: 本发明提供一种词向量的生成方法、装置、电子设备及存储介质，该方法包括：获取至少一个目标词，所述目标词包括所述词典中的至少一个第一词汇，和/或，所述知识库中的至少一个头实体，所述知识库中包括至少两个用于表示知识的三元组数据；确定各所述目标词对应的至少一个释义词，所述释义词包括用于解释所述第一词汇的第二词汇，和/或，所述头实体对应的关系和尾实体；基于所述目标词和所述释义词，确定词向量矩阵，所述词向量矩阵的每一行表示一个词向量，所述词向量用于表征所述目标词或所述释义词的语义信息。本发明提供的词向量的生成方法、装置、电子设备及存储介质可以增强词向量的可解释性。

7.

发明公开
语音转录文本聚类方法、装置、电子设备和存储介质审中-实审

公开(公告)号：CN115238068A

公开(公告)日：2022-10-25

申请号：CN202210709135.X

申请日：2022-06-21

Applicant: 中国科学院自动化研究所

Inventor： 曾杰林 , 李林静 , 梁嘉琦 , 曾大军

IPC: G06F16/35 , G06F40/30 , G10L15/26 , G06N20/00

Abstract: 本发明提供一种语音转录文本聚类方法、装置、电子设备和存储介质，所述方法包括：提取各语音转录文本的向量表示；将各语音转录文本的向量表示输入至文本聚类模型，得到文本聚类模型输出的各语音转录文本的聚类结果；本发明以最小化相同样本语音转录文本的向量表示之间的距离，最大化不同样本语音转录文本的向量表示之间的距离，最小化样本语音转录文本的向量表示与其所属类别的语义向量之间的距离以及最大化样本语音转录文本的向量表示与其它类别的语义向量之间的距离为目标迭代更新训练得到文本聚类模型，最终使得文本聚类模型能够从文本层面和类别层面对各语音转录文本进行聚类，进而准确得到聚类结果。

8.

发明公开
媒体转引类型的识别方法、装置、电子设备及存储介质有权

公开(公告)号：CN114818733A

公开(公告)日：2022-07-29

申请号：CN202210555613.6

申请日：2022-05-20

Applicant: 中国科学院自动化研究所

Inventor： 李秋丹 , 王林子 , 任亚俊 , 彭鑫 , 曾大军

IPC: G06F40/30 , G06F40/253 , G06F40/211 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种媒体转引类型的识别方法、装置、电子设备及存储介质，属于自然语言处理领域。其中，该方法包括：将源媒体发布的源信息和转引媒体发布的转引信息输入预训练语言模型，分别得到源信息和转引信息的篇章表示向量以及句子表示向量；对源信息和转引信息的各句子表示向量进行双向交互式语义信息学习，得到双向的交互语义篇章表示向量；将基于预训练语言模型得到篇章表示向量和交互语义篇章表示向量进行融合，得到增强语义表示向量；根据所述增强语义表示向量进行媒体转引类型识别，得到媒体转引类型。通过本发明，实现了多层级、细粒度地增强篇章的语义表征能力，有效提升媒体转引类型的识别性能。

9.

发明授权
融合用户行为和文本信息的社交机器人检测方法和系统有权

公开(公告)号：CN108763319B

公开(公告)日：2022-02-08

申请号：CN201810396753.7

申请日：2018-04-28

Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

Inventor： 刘春阳 , 张旭 , 蔡驰宇 , 曾大军 , 李雄 , 李林静 , 王萌 , 彭鑫 , 王慧

IPC: G06F16/335 , G06N3/04 , G06Q50/00

Abstract: 本发明属于计算机技术领域，具体提供了一种融合用户行为和文本信息的社交机器人检测方法和系统。旨在解决现有技术手动选取特征、忽略社交媒体帖子之间的逻辑性和时序性以及忽略社交平台用户行为信息的问题，本发明的社交机器人的检测方法包括获取待检测社交媒体用户的历史网络数据和好友网络数据；基于上述数据得到用户文本特征向量、行为特征向量以及好友网络特征向量，并将其融合，得到待检测社交媒体用户的用户特征向量；对用户特征向量进行检测，输出检测结果。本发明的方法更加符合社交媒体自身的特性，从多个维度分析待检测社交媒体用户，提升了检测准确率。本发明的系统同样具有上述有益效果。

10.

发明公开
事件信息关键词提取方法、监控方法、及其系统和装置有权

公开(公告)号：CN109800431A

公开(公告)日：2019-05-24

申请号：CN201910062802.8

申请日：2019-01-23

Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

Inventor： 孔庆超 , 张旭 , 刘春阳 , 郎佳奇 , 王鹏 , 闫鹏 , 彭鑫 , 曾大军

IPC: G06F17/27 , G06F16/35

Abstract: 本发明属于计算机科学技术领域，尤其是涉及一种事件信息关键词提取方法、监控方法、及其系统和装置，旨在为了解决解决无监督方法提取关键词效果不稳定的问题。本发明提取方法对于获取的待监控的事件信息，基于多种关键词提取技术提取并优选一组相关性很强的关键词作为第一关键词组，而后基于关键词在时域的发展演化选出最新的热点词汇作为第二关键词组，再后对同一时间段内的同一事件的不同报道进行聚类，提取各聚类的关键词合并后作为第三关键字组，最后合并三个关键词组并选定最终的关键词组合。本发明提高了系统的稳定性，同时兼顾了时域及同一事件不同侧面的发展方向。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification