一种基于注意力导向细节修复的文档图像阴影去除方法

    公开(公告)号:CN118898847A

    公开(公告)日:2024-11-05

    申请号:CN202411390566.X

    申请日:2024-10-08

    摘要: 本发明提出一种基于注意力导向细节修复的文档图像阴影去除方法,包括以下步骤;步骤S1、利用YCbCr颜色空间变换和亮度信息生成阴影注意力图作为标签,以识别阴影区域;步骤S2、通过阴影注意力生成子网络,采用多尺度大核注意力机制,提取阴影特征,获得最优注意力图;步骤S3、对所述最优注意力图和阴影特征进行动态融合;步骤S4、通过细节细化子网络,采用轻量级空间通道卷积计算并恢复图像细节;步骤S5、基于损失函数,通过端到端训练优化网络参数;步骤S6、使用训练完成的网络对文档图像进行阴影去除处理。旨在有效去除文档图像中的复杂阴影,同时保留图像细节,并以较低的计算复杂度实现。

    基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质

    公开(公告)号:CN118471253B

    公开(公告)日:2024-10-11

    申请号:CN202410917115.0

    申请日:2024-07-10

    摘要: 本发明提供了基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质,包括:进行音调移位,将输入音频进行音调移位,以改变音频的频率并引发ASR系统的初步误识别;使用语音活动检测识别音频中的活跃语音片段,生成二进制掩码以标识这些片段;进行稀疏噪声生成;将优化后的扰动向量与掩码向量相结合,生成最终的对抗性音频样本,使其能够有效攻击ASR系统并且难以被人耳察觉。本发明实现了在保持对抗性音频可听性的同时,简化攻击过程并提高了对抗性噪声的隐蔽性和有效性。

    大脑动脉环多模态分割中时间语义一致性确保方法、装置

    公开(公告)号:CN118379501B

    公开(公告)日:2024-08-30

    申请号:CN202410805765.6

    申请日:2024-06-21

    摘要: 本发明提供了大脑动脉环多模态分割中时间语义一致性确保方法、装置,本方法首先,通过引入跨时间对齐和注意力机制,有效整合多模态数据,提高了分割结果的准确性和鲁棒性;其次,开发了时间对齐模块(TAM)和跨时间跨模态注意力模块(CCAM),确保对治疗效果的准确评估;再次,引入了Laplacian Enhanced Fourier Encoder(LEFE),显著提升了对细小和复杂血管结构的检测和分割能力;最后,设计了一种新的损失函数,强制不同模态下的语义一致性,提高了跨模态数据处理的一致性和准确性。

    基于灰度不变性的双阶段集成可逆对抗攻击方法、装置、设备和介质

    公开(公告)号:CN118246070B

    公开(公告)日:2024-08-06

    申请号:CN202410670082.4

    申请日:2024-05-28

    摘要: 本发明提供一种基于灰度不变性的双阶段集成可逆对抗攻击方法、装置、设备和介质,涉及图像对抗处理技术领域。其包含步骤S1至步骤S4以根据初始图像生成可逆对抗攻击样本。S1、获取初始图像。S2、通过动量迭代快速梯度攻击法和梯度量化二进制编码对所述初始图像进行白盒攻击,获取第一扰动信息和第一对抗攻击样本。S3、对所述第一对抗攻击样本进行黑盒攻击,对未能成功攻击目标网络的部分样本,采用阈值信息超像素攻击进一步调整扰动,获取第二扰动信息和第二对抗攻击样本。S4、将所述第二扰动信息的扰动矩阵编码为二进制信息流,然后使用可逆数据隐藏技术RDH将所述二进制信息流嵌入所述第二对抗攻击样本,获得最终的双阶段集成可逆对抗攻击样本。

    一种基于多源信息融合的遥感图像语义分割方法

    公开(公告)号:CN117853945A

    公开(公告)日:2024-04-09

    申请号:CN202410037867.8

    申请日:2024-01-10

    摘要: 本发明涉及一种基于多源信息融合的遥感图像语义分割方法(即MSGFormer)。具体来说MSGFormer包含三个模块首先,MSG(多尺度自注意全局特征融合),通过多尺度卷积将不同大小感受野的特征图通过自注意卷积去除冗余特征,获得长距离依赖关系集成到每个解码器阶段。其次PA(坐标注意力)有效解决了类别之间的位置联系;最后提取解码器的低级语义信息(CNN_Stem)作为支流注入解码器上采样最后一层中作为细节分割补充。本发明方法在两个公开的基准数据集上优于当前最先进的算法。