一种基于注意力导向细节修复的文档图像阴影去除方法

    公开(公告)号:CN118898847A

    公开(公告)日:2024-11-05

    申请号:CN202411390566.X

    申请日:2024-10-08

    摘要: 本发明提出一种基于注意力导向细节修复的文档图像阴影去除方法,包括以下步骤;步骤S1、利用YCbCr颜色空间变换和亮度信息生成阴影注意力图作为标签,以识别阴影区域;步骤S2、通过阴影注意力生成子网络,采用多尺度大核注意力机制,提取阴影特征,获得最优注意力图;步骤S3、对所述最优注意力图和阴影特征进行动态融合;步骤S4、通过细节细化子网络,采用轻量级空间通道卷积计算并恢复图像细节;步骤S5、基于损失函数,通过端到端训练优化网络参数;步骤S6、使用训练完成的网络对文档图像进行阴影去除处理。旨在有效去除文档图像中的复杂阴影,同时保留图像细节,并以较低的计算复杂度实现。

    基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质

    公开(公告)号:CN118471253B

    公开(公告)日:2024-10-11

    申请号:CN202410917115.0

    申请日:2024-07-10

    摘要: 本发明提供了基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质,包括:进行音调移位,将输入音频进行音调移位,以改变音频的频率并引发ASR系统的初步误识别;使用语音活动检测识别音频中的活跃语音片段,生成二进制掩码以标识这些片段;进行稀疏噪声生成;将优化后的扰动向量与掩码向量相结合,生成最终的对抗性音频样本,使其能够有效攻击ASR系统并且难以被人耳察觉。本发明实现了在保持对抗性音频可听性的同时,简化攻击过程并提高了对抗性噪声的隐蔽性和有效性。

    大脑动脉环多模态分割中时间语义一致性确保方法、装置

    公开(公告)号:CN118379501B

    公开(公告)日:2024-08-30

    申请号:CN202410805765.6

    申请日:2024-06-21

    摘要: 本发明提供了大脑动脉环多模态分割中时间语义一致性确保方法、装置,本方法首先,通过引入跨时间对齐和注意力机制,有效整合多模态数据,提高了分割结果的准确性和鲁棒性;其次,开发了时间对齐模块(TAM)和跨时间跨模态注意力模块(CCAM),确保对治疗效果的准确评估;再次,引入了Laplacian Enhanced Fourier Encoder(LEFE),显著提升了对细小和复杂血管结构的检测和分割能力;最后,设计了一种新的损失函数,强制不同模态下的语义一致性,提高了跨模态数据处理的一致性和准确性。

    基于灰度不变性的双阶段集成可逆对抗攻击方法、装置、设备和介质

    公开(公告)号:CN118246070B

    公开(公告)日:2024-08-06

    申请号:CN202410670082.4

    申请日:2024-05-28

    摘要: 本发明提供一种基于灰度不变性的双阶段集成可逆对抗攻击方法、装置、设备和介质,涉及图像对抗处理技术领域。其包含步骤S1至步骤S4以根据初始图像生成可逆对抗攻击样本。S1、获取初始图像。S2、通过动量迭代快速梯度攻击法和梯度量化二进制编码对所述初始图像进行白盒攻击,获取第一扰动信息和第一对抗攻击样本。S3、对所述第一对抗攻击样本进行黑盒攻击,对未能成功攻击目标网络的部分样本,采用阈值信息超像素攻击进一步调整扰动,获取第二扰动信息和第二对抗攻击样本。S4、将所述第二扰动信息的扰动矩阵编码为二进制信息流,然后使用可逆数据隐藏技术RDH将所述二进制信息流嵌入所述第二对抗攻击样本,获得最终的双阶段集成可逆对抗攻击样本。

    一种基于多源信息融合的遥感图像语义分割方法

    公开(公告)号:CN117853945A

    公开(公告)日:2024-04-09

    申请号:CN202410037867.8

    申请日:2024-01-10

    摘要: 本发明涉及一种基于多源信息融合的遥感图像语义分割方法(即MSGFormer)。具体来说MSGFormer包含三个模块首先,MSG(多尺度自注意全局特征融合),通过多尺度卷积将不同大小感受野的特征图通过自注意卷积去除冗余特征,获得长距离依赖关系集成到每个解码器阶段。其次PA(坐标注意力)有效解决了类别之间的位置联系;最后提取解码器的低级语义信息(CNN_Stem)作为支流注入解码器上采样最后一层中作为细节分割补充。本发明方法在两个公开的基准数据集上优于当前最先进的算法。

    基于Transformer的交互式图像分割方法

    公开(公告)号:CN117372701B

    公开(公告)日:2024-03-12

    申请号:CN202311667809.5

    申请日:2023-12-07

    摘要: 本发明公开基于Transformer的交互式图像分割方法,选取想要标注的图像,载入到交互式图像分割标注软件中;选择分割目标,根据用户点击行为生成点击记录,在对应位置生成点击标记;确认交互完成后,根据点击记录将其转换为圆盘图,作为相对应的正负点击指导再和原始掩码拼接,在与原图相加后作为分割模型输入;利用预训练分割模型对图像中的指定目标进行分割,返回初始的分割掩码;根据初始的分割掩码结果,选择添加合适的正负点击对错误区域进行再次标记;将新的标记再次送入分割模型,并返回修正后的结果。如此往复,对分割结果进行细化,以得到满意的结果。本发明能提高交互式图像分割标注性能,以更少的交互次数得到更好的分割结果。

    基于并行共享多任务网络的人脸属性识别方法及系统

    公开(公告)号:CN113569732B

    公开(公告)日:2023-06-06

    申请号:CN202110853369.7

    申请日:2021-07-27

    摘要: 本发明涉及一种基于并行共享多任务网络的人脸属性识别方法及系统,该方法包括以下步骤:将人脸属性数据集中包含的人脸属性分为部分属性组和整体属性组;构建并行共享多任务网络,其由一个共享子网络以及两个特定任务子网络,即一个部分属性子网络和一个整体属性子网络组成;在每个特定任务子网络中采用注意力机制,以利用共享子网络和特定任务子网络的局部和全局特征之间的相关性;设定损失函数并采用自适应惩罚策略来缓解类别不平衡问题,提高人脸属性识别率;通过人脸属性数据集对并行共享多任务网络进行训练;将待识别的人脸图像输入训练好的并行共享多任务网络模型,实现人脸属性识别。该方法及系统有利于提高人脸属性识别的准确性。

    一种基于深度学习的图像超分辨率重建方法及系统

    公开(公告)号:CN114972032A

    公开(公告)日:2022-08-30

    申请号:CN202210630016.5

    申请日:2022-06-06

    IPC分类号: G06T3/40 G06N3/04

    摘要: 本发明提出基于深度学习的图像超分辨率重建方法及系统,属于图像重建技术领域。方法包括步骤S1:获取第一分辨率组合的多个原始视频帧;S2:将所述多个原始视频帧进行分组,得到多个分组视频帧;S3:针对每一个分组视频帧执行超分辨率重建,得到第二分辨率组合的多个重建视频帧;S4:融合所述多个重建视频帧,得到所述原始视频帧的超分辨率重建结果。系统包括视频帧获取单元、视频帧分组单元、分组重建单元以及视频帧融合单元,用于实现所述方法。本发明的技术方案可以基于原始视频帧的时间戳和视角信息选择对应的深度学习模型执行分辨率重建,避免了单一重建方法带来的视角差异以及时间错误问题。