一种基于关键词的短文本相似度预测方法

    公开(公告)号:CN114528831A

    公开(公告)日:2022-05-24

    申请号:CN202210136839.2

    申请日:2022-02-15

    摘要: 本发明提供一种基于关键词的短文本相似度预测方法,属于自然语言处理技领域,首先,提取短文本数据中的核心内容,构建关键词库;其次,短文本对关键内容提取,基于关键词库,扩充短文对的关键信息,构造关键信息权重向量;再次,短文本对语义特征提取并融合关键信息,基于transformer单元,关联短文本对的上下文语义信息,并利用关键信息权重向量,使注意力机制重点关注于关键信息,减少无用信息对结果的干扰;最后,基于分类网络,预测短文本对的相似度。解决短文本相似度匹配中关键信息捕获无力、一词多义现象导致的准确性较低的问题。

    一种行人重识别的方法、装置及计算机可读存储介质

    公开(公告)号:CN114332955A

    公开(公告)日:2022-04-12

    申请号:CN202210234725.1

    申请日:2022-03-11

    摘要: 本申请公开了一种行人重识别的方法、装置及计算机可读存储介质,涉及数字图像处理技术领域。通过先确定第一图像和第二图像各自的全局特征信息、局部特征信息和局部特征信息之间的互注意力权重信息,根据第一图像和第二图像对应的全局特征信息和局部特征信息,确定第一图像和第二图像的特征信息,并将第一图像的特征信息和第二图像的特征信息进行拼接,并对拼接结果进行识别。可见,此方法,通过全局特征信息和局部特征信息相结合的方式,在不同背景时,全局特征信息可以对行人所在的区域进行定位,进一步提取局部特征信息,在背景相似时,局部信息可以根据局部信息之间的互注意力权重信息对有遮挡的部位的特征进行获取,使检测结果更加准确。

    一种适用于文本图像的图像对齐方法

    公开(公告)号:CN113947678A

    公开(公告)日:2022-01-18

    申请号:CN202111170598.5

    申请日:2021-10-08

    摘要: 本发明涉及图像处理技术领域,具体提供了一种适用于文本图像的图像对齐方法,首先,字段特征提取,分别提取模板图和待对齐图中的字段特征,其次,同义字段对齐,计算模板图与待对齐图中两两字段特征之间的相似度,定位模板图和带对齐图的同名同含义字段,得到配对的字段对,最后,精确配对位置对齐及配对点优选,进而完成图像对齐。与现有技术相比,本发明的基于字符特征进行关键点提取,相对于传统sift特征,其维度更丰富且具有实际意义,对图像的拍摄环境受限较小,模板图和待对齐图存在拍摄环境差异和畸变情况,仍能保持较好的准确性。

    基于注意力空间划分的数据增强处理方法

    公开(公告)号:CN116610801A

    公开(公告)日:2023-08-18

    申请号:CN202310581534.7

    申请日:2023-05-23

    摘要: 本发明涉及数据增强技术领域,具体为基于注意力空间划分的数据增强处理方法,包括以下步骤:S1原始训练数据预处理;S2将文本向量T输入到词嵌入层,获得嵌入向量X∈RL×E;S3将向量数据输入到主干网络,获得文本特征向量;S4将特征向量输入到注意力网络,利用多头注意力网络之间的差异性,进行语义空间划分;S5计算分类类别的交叉熵损失;S6计算关联损失与模型总损失,进行模型参数更新。有益效果为:本发明提出的基于注意力空间划分的数据增强处理方法,适用于各类文本任务及图像任务,利用注意力空间划分的方式,发展出一种新型数据增强方法,解决了少量样本数据情况下训练收敛速度过慢、过拟合的问题,有效增加样本多样性。

    一种面向数据不均衡的联邦聚合方法及装置

    公开(公告)号:CN116340790A

    公开(公告)日:2023-06-27

    申请号:CN202310182577.8

    申请日:2023-03-01

    IPC分类号: G06F18/23 G06N20/20

    摘要: 本发明涉及联邦学习技术领域,具体提供了一种面向数据不均衡的联邦聚合方法及装置,具有如下步骤:S1、构建数据质量向量,由梯度因子、分布因子、数量因子组成;S2、以数据质量向量作为聚类特征,对参与方进行聚类分析,实现参与方分组;S3、基于分组聚合梯度的方式,完成全局梯度计算。与现有技术相比,本发明构建了一个数据质量描述向量,权衡了数据不均衡情况下各个参与方数据的数量、质量、模型贡献,多角度衡量数据集之间的差异,且基于此向量的聚类分析可以大大提升通讯效率。