-
公开(公告)号:CN116089868A
公开(公告)日:2023-05-09
申请号:CN202211462734.2
申请日:2022-11-21
Applicant: 中国科学院自动化研究所 , 天津中科智能识别有限公司
IPC: G06F18/241 , G06F40/30
Abstract: 本发明提供一种文本分类模型的攻击方法、装置、电子设备以及存储介质,涉及人工智能安全技术领域,所述方法包括:获取待分类文本以及预先训练好的目标生成器,所述目标生成器基于第一训练数据对原始生成器进行训练得到,所述原始生成器基于掩码语言模型构建;将所述待分类文本输入至所述目标生成器中,得到所述待分类文本对应的目标错分文本;将所述目标错分文本输出至待攻击分类模型中,得到所述待分类文本对应的目标错分结果,以解决现有技术中对文本分类模型的攻击效率低以及生成的错分文本的语义质量低的技术问题。
-
公开(公告)号:CN115827876A
公开(公告)日:2023-03-21
申请号:CN202310032603.9
申请日:2023-01-10
Applicant: 中国科学院自动化研究所
IPC: G06F16/35 , G06F40/205
Abstract: 本申请提供一种未标注文本的确定方法、装置和电子设备,涉及数据处理技术领域。该方法包括:获取多个未标注文本、多个已标注文本以及多个已标注文本各自的类别标签;分别将多个未标注文本和多个已标注文本输入至文本类别分析模型的特征提取网络中,根据得到的多个未标注文本各自对应的特征向量和多个已标注文本各自对应的特征向量,从多个未标注文本中确定多个候选未标注文本;根据多个候选未标注文本各自对应的类别标签分布熵值,从多个候选未标注文本中确定目标未标注文本,目标未标注文本用于训练文本类别分析模型,可以准确地选择未标注文本,从而提高了训练得到的文本类别分析模型的泛化能力。
-
公开(公告)号:CN115168572A
公开(公告)日:2022-10-11
申请号:CN202210692343.3
申请日:2022-06-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种文本处理方法、文本处理装置和电子设备,涉及人工智能技术领域。该方法包括:获取多个原始样本,所述原始样本包括文本和标签;生成每个所述原始样本的对抗样本,基于所述对抗样本确定每个所述原始样本的正样本和负样本;基于所述正样本、所述负样本进行监督对比学习和对抗训练得到文本分类模型,采用所述文本分类模型对待处理文本进行分类。本发明能提高文本分类模型的鲁棒性。
-
公开(公告)号:CN109918584A
公开(公告)日:2019-06-21
申请号:CN201910228791.6
申请日:2019-03-25
Applicant: 中国科学院自动化研究所
IPC: G06F16/9537
Abstract: 本发明属于信息技术及安全技术领域,具体涉及一种比特币交易所地址识别方法、系统、装置,旨在解决基于比特币的交易信息判断输入的地址信息是否为交易所地址的问题,本发明方法包括:获取包括比特币地址标识符、比特币流向数据的待识别交易数据作为输入信息;基于输入信息构建比特币交易网络;利用网络表示学习法获取比特币交易网络中节点的特征向量构成特征空间,进一步通过地址分类器识别输入信息中比特币地址标识符是否为真实的比特币交易所地址。本发明中的地址分类器基于交易数据样本和标签样本训练得到,为基于多个映射函数的分类器模型的组合。本发明依赖资源少,且能直接识别交易所地址,达到较好的识别率。
-
公开(公告)号:CN117217287A
公开(公告)日:2023-12-12
申请号:CN202311000674.7
申请日:2023-08-09
Applicant: 中国科学院自动化研究所 , 中国人民解放军军事科学院国防科技创新研究院
Abstract: 本发明提供一种面向分层强化学习的多元子策略生成模型的训练方法,方法包括:确定初始分层强化学习模型;基于所述初始分层强化学习模型选择进行强化学习时的各子策略;基于所述各子策略之间的瓦式距离,确定所述各子策略之间的子策略策略网络的第一损失;基于所述第一损失,对所述初始分层强化学习模型进行参数迭代,得到所述多元子策略生成模型。本发明提供的方法,通过在具有固定数量子策略的初始分层强化学习模型中加入基于瓦式距离正则项的方法,在不改变模型原有超参数的前提下,增加多元子策略生成模型学习到的子策略的多样性,进而提升多元子策略生成模型在离散和连续动作环境下的性能表现和样本效率。
-
公开(公告)号:CN115827876B
公开(公告)日:2023-06-02
申请号:CN202310032603.9
申请日:2023-01-10
Applicant: 中国科学院自动化研究所
IPC: G06F16/35 , G06F40/205
Abstract: 本申请提供一种未标注文本的确定方法、装置和电子设备,涉及数据处理技术领域。该方法包括:获取多个未标注文本、多个已标注文本以及多个已标注文本各自的类别标签;分别将多个未标注文本和多个已标注文本输入至文本类别分析模型的特征提取网络中,根据得到的多个未标注文本各自对应的特征向量和多个已标注文本各自对应的特征向量,从多个未标注文本中确定多个候选未标注文本;根据多个候选未标注文本各自对应的类别标签分布熵值,从多个候选未标注文本中确定目标未标注文本,目标未标注文本用于训练文本类别分析模型,可以准确地选择未标注文本,从而提高了训练得到的文本类别分析模型的泛化能力。
-
公开(公告)号:CN119250156B
公开(公告)日:2025-03-21
申请号:CN202411758866.9
申请日:2024-12-03
Applicant: 中国科学院自动化研究所
IPC: G06N3/092 , G06N3/0455 , G06N3/0985 , G06F18/22
Abstract: 本发明提供一种离线元强化学习模型训练方法、装置、设备、介质及产品,涉及人工智能技术领域,方法包括:基于不同训练任务之间的相似度对上下文编码器进行训练,以最小化相似度高于阈值的训练任务的表示向量之间的距离,最大化相似度低于阈值的训练任务的表示向量之间的距离;基于保守Q学习对Q函数网络进行训练,以最小化标准贝尔曼误差,和最小化训练策略对应的Q值与行为策略对应的Q值之间的差距;基于行为正则化演员评判家对策略网络进行训练,以限制训练策略与行为策略之间的差异;根据训练好的上下文编码器、Q函数网络和策略网络,得到训练好的离线元强化学习模型。本发明实现增强离线元强化学习模型的性能表现、鲁棒性和泛化能力。
-
公开(公告)号:CN119250156A
公开(公告)日:2025-01-03
申请号:CN202411758866.9
申请日:2024-12-03
Applicant: 中国科学院自动化研究所
IPC: G06N3/092 , G06N3/0455 , G06N3/0985 , G06F18/22
Abstract: 本发明提供一种离线元强化学习模型训练方法、装置、设备、介质及产品,涉及人工智能技术领域,方法包括:基于不同训练任务之间的相似度对上下文编码器进行训练,以最小化相似度高于阈值的训练任务的表示向量之间的距离,最大化相似度低于阈值的训练任务的表示向量之间的距离;基于保守Q学习对Q函数网络进行训练,以最小化标准贝尔曼误差,和最小化训练策略对应的Q值与行为策略对应的Q值之间的差距;基于行为正则化演员评判家对策略网络进行训练,以限制训练策略与行为策略之间的差异;根据训练好的上下文编码器、Q函数网络和策略网络,得到训练好的离线元强化学习模型。本发明实现增强离线元强化学习模型的性能表现、鲁棒性和泛化能力。
-
公开(公告)号:CN115238068A
公开(公告)日:2022-10-25
申请号:CN202210709135.X
申请日:2022-06-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种语音转录文本聚类方法、装置、电子设备和存储介质,所述方法包括:提取各语音转录文本的向量表示;将各语音转录文本的向量表示输入至文本聚类模型,得到文本聚类模型输出的各语音转录文本的聚类结果;本发明以最小化相同样本语音转录文本的向量表示之间的距离,最大化不同样本语音转录文本的向量表示之间的距离,最小化样本语音转录文本的向量表示与其所属类别的语义向量之间的距离以及最大化样本语音转录文本的向量表示与其它类别的语义向量之间的距离为目标迭代更新训练得到文本聚类模型,最终使得文本聚类模型能够从文本层面和类别层面对各语音转录文本进行聚类,进而准确得到聚类结果。
-
-
-
-
-
-
-
-