基于多尺度差异信息和集中式Transformer网络的视觉定位方法

    公开(公告)号:CN117788845A

    公开(公告)日:2024-03-29

    申请号:CN202311718609.8

    申请日:2023-12-14

    摘要: 本发明公开了基于多尺度差异信息和集中式Transformer网络的视觉定位方法。现有方法直接提取多尺度特征来捕获图像中不同尺度的信息容易产生大量冗余信息,削弱不同尺度特征之间的互补性,导致定位不准确和边缘模糊。本发明提出了一种独特的具有多尺度差异信息的集中式transformer网络,用于视觉定位任务。设计了一个新的多尺度差异信息模块,通过计算不同尺度特征的变化来提取独特的信息。这使得网络能够专注于捕捉细粒度的细节,同时保持对视觉内容的整体理解。为了增强跨模态的交互,进一步提出了集中式transformer,以同时聚合多模态融合特征的局部本质信息和全局距离相关性。在3个典型数据集上的综合实验验证了所提方法的优越性。

    一种抗多噪音干扰的地震波速度建模方法

    公开(公告)号:CN116908912A

    公开(公告)日:2023-10-20

    申请号:CN202310499391.5

    申请日:2023-05-06

    IPC分类号: G01V1/30 G01V1/28

    摘要: 本发明公开了一种抗多噪音干扰网络的地震波速度建模方法。随着采集数据的增加,速度建模的工作量剧增。尤其是在地表、地下结构复杂的低信噪比探区,速度谱能量团的聚焦性非常差,速度拾取非常困难。因此,适应复杂低信噪比的智能化速度建模非常迫切。本发明首次提出了一种抗多噪音干扰网络来研究炮记录之间的对应关系,可以直接从原始地震记录中构建速度模型。所提出的随机噪音模块可以使模型更好地泛化,并提高模拟受干扰噪声的炮记录速度的准确性。在SEG Salt和Simulated数据集上进行的大量实验表明,该模型在地震波速度建模方面取得了很好的结果。

    基于语义保留的对抗混合半监督高光谱图像分类方法

    公开(公告)号:CN113807438B

    公开(公告)日:2023-08-29

    申请号:CN202111093418.8

    申请日:2021-09-17

    摘要: 本发明涉及一种基于语义保留的对抗混合半监督高光谱图像分类方法,所述方法在训练阶段包括以下步骤:步骤1、通过特征提取网络对有标签样本进行特征提取;步骤2、通过所述特征提取网络对从样本集中随机抽取的两个无标签样本进行特征提取,将所提取的两个无标签样本的特征混合后送入重构网络;步骤3、通过所述重构网络重构样本,将重构的样本送入对抗语义还原网络;步骤4、通过联合损失函数来优化特征提取网络、重构网络和对抗语义还原网络的参数。所述方法在测试阶段包括以下步骤:步骤5、将需要分类的高光谱图像的无标签样本送入所述特征提取网络,提取特征之后通过分类函数得到作为分类结果的标签。

    基于图注意力网络的多层次图像-文本匹配方法

    公开(公告)号:CN113191357B

    公开(公告)日:2023-01-17

    申请号:CN202110550780.7

    申请日:2021-05-18

    摘要: 本发明公开了基于图注意力网络的多层次图像‑文本匹配方法。该任务的关键挑战在于学习图像和文本间的对应关系。现有的工作大多只学习对象之间的局部语义关系,而针对对象及其关系间的局部短句关系的研究工作很少。本发明从图视域出发,构建了一种基于图注意力网络的多层次图像‑文本匹配方法。该网络通过对图片区域和文本单词构建注意力图结构进行图匹配,以此推断细粒度的结构化短句对应关系。同时,根据构建的图结构推理全局语义进行全局匹配作为图匹配的补充,来实现更全面的跨媒体语义匹配。经过大量实验证明,基于图注意力网络的多层次图像‑文本匹配方法可以同时学习图视域匹配和全局视域匹配,并在MSCOCO和Flickr30K数据集上取得了有竞争力的结果。

    基于场景图更新与特征拼接的图像字幕生成方法

    公开(公告)号:CN113918754A

    公开(公告)日:2022-01-11

    申请号:CN202111283716.3

    申请日:2021-11-01

    IPC分类号: G06F16/583 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于场景图更新与特征拼接的图像字幕生成方法,它解决了当前基于场景图的图像字幕模型中长短期记忆神经网络丢失先前输入的细节信息的问题,以及场景图更新机制中结点更新程度过大的问题。本发明首次提出了特征拼接网络,该网络对语言LSTM的输入变量做了改进,目的是尽可能多地保留原始输入信息,减少输入信息在计算过程中的损失。其次,本发明提出一种新的场景图更新机制来更新已访问过的结点权重,避免引起结点信息丢失的问题。同时,本发明设计了图更新系数来指导图更新,以确定更新程度的大小。本发明在官方数据集Microsoft COCO上进行了实验,在各种评估机制的实验中取得了有竞争力的结果。

    基于语义保留的对抗混合半监督高光谱图像分类方法

    公开(公告)号:CN113807438A

    公开(公告)日:2021-12-17

    申请号:CN202111093418.8

    申请日:2021-09-17

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明涉及一种基于语义保留的对抗混合半监督高光谱图像分类方法,所述方法在训练阶段包括以下步骤:步骤1、通过特征提取网络对有标签样本进行特征提取;步骤2、通过所述特征提取网络对从样本集中随机抽取的两个无标签样本进行特征提取,将所提取的两个无标签样本的特征混合后送入重构网络;步骤3、通过所述重构网络重构样本,将重构的样本送入对抗语义还原网络;步骤4、通过联合损失函数来优化特征提取网络、重构网络和对抗语义还原网络的参数。所述方法在测试阶段包括以下步骤:步骤5、将需要分类的高光谱图像的无标签样本送入所述特征提取网络,提取特征之后通过分类函数得到作为分类结果的标签。

    基于带有主题约束的区域强化网络的图像-文本匹配方法

    公开(公告)号:CN112084358A

    公开(公告)日:2020-12-15

    申请号:CN202010918759.3

    申请日:2020-09-04

    摘要: 本发明公开了基于带有主题约束的区域强化网络的图像‑文本匹配方法。该任务由于能将不同的模态关联起来而受到广泛的关注。以往的方法主要对区域‑单词对之间的相似性进行聚合来寻找区域和单词之间的对应关系。然而,这些方法很少考虑图像中不同区域的关系而平等对待所有区域。此外,过于关注区域单词对齐可能会曲解图像。本发明首次提出了基于带有主题约束的区域强化网络来研究图像和文本之间的对应关系。设计一个具有交叉注意力的区域强化网络,通过考虑区域之间的关系重新分配区域‑单词的相似性来推断细粒度的对应关系。并提出主题约束模块,总结图像的中心主题以约束原始图像的偏离。本发明在MSCOCO和Flicr30K上进行大量实验证明了提出模型的有效性。

    一种用于随钻测量系统数据压缩的方法

    公开(公告)号:CN104410425A

    公开(公告)日:2015-03-11

    申请号:CN201410532348.5

    申请日:2014-10-10

    IPC分类号: H03M7/40 E21B47/12

    摘要: 本发明提供了一种用于随钻测量系统数据压缩的方法,是石油随钻测量系统井下测量的参数上传系统中数据压缩的方法,从而实现高效的数据传输。发明主要通过①系统初始化;②发送数据;③修改该序号的数据报的权值;④判断自上次重构编码后的时间是否大于设定时间周期;⑤计算所有字符的权值的标准差;⑥判断标准差是否大于设定阈值;⑦发送该序号数据报的Huffman权值表;⑧对本地该序号的数据报的字符重新进行Huffman编码等8个步骤来实现,用于石油钻井、测井、录井等随钻测量系统中数据的压缩,实现数据的高效传输。

    一种基于专用短程通信技术的多车协同测距的方法

    公开(公告)号:CN104079670A

    公开(公告)日:2014-10-01

    申请号:CN201410348584.1

    申请日:2014-07-22

    摘要: 本发明涉及无线通信技术,具体是一种基于专用短程通信技术的多车协同测距的方法。主要原理是:通过将测距请求帧和测距应答帧合二为一,分别组播直接后继车辆和其他后继车辆的传播时延,从而实现所有车辆之间的测距,具体步骤是:组播发送测距帧、计算与直接后继车辆的传播时延、组播发送与直接后继车辆之间的传播时延、计算与非直接后继车辆的传播时延、组播与非直接后继车辆的传播时延。至此所有的车辆均知道了其与其他N-1辆车的传播时延,然后乘以电磁波的传播速度,即可得到与其他所有的N-1辆车的距离。该方法可以使用较少的数据通信让每辆车均获得所有的其他车辆的距离,进而计算得到每辆车的相对位置,可用于智能交通、车辆防碰撞领域。