- 专利标题: 基于双向跨模态注意力机制的RGB-D大坝缺陷图像语义分割方法
-
申请号: CN202410358422.X申请日: 2024-03-27
-
公开(公告)号: CN118334330A公开(公告)日: 2024-07-12
- 发明人: 钱勇 , 毛莺池 , 赵培双 , 李洪波 , 潘祯祥 , 廖贵能 , 陈时 , 彭欣欣 , 张礼兵 , 刘军显 , 李耀德 , 王海燕 , 吴智明 , 马江霞 , 杨福平 , 赵家尧 , 吴永奇 , 孙亚民 , 孔岩鑫 , 查海华 , 李临国 , 李景卫 , 陈汝春
- 申请人: 河海大学 , 华能澜沧江水电股份有限公司 , 中国电建集团昆明勘测设计研究院有限公司
- 申请人地址: 江苏省南京市江宁区佛城西路8号; ;
- 专利权人: 河海大学,华能澜沧江水电股份有限公司,中国电建集团昆明勘测设计研究院有限公司
- 当前专利权人: 河海大学,华能澜沧江水电股份有限公司,中国电建集团昆明勘测设计研究院有限公司
- 当前专利权人地址: 江苏省南京市江宁区佛城西路8号; ;
- 代理机构: 南京乐羽知行专利代理事务所
- 代理商 李玉平
- 主分类号: G06V10/26
- IPC分类号: G06V10/26 ; G06V10/44 ; G06V10/80 ; G06V10/82 ; G06N3/0464
摘要:
本发明公开一种基于双向跨模态注意力机制的RGB‑D大坝缺陷图像语义分割方法,对输入的RGB‑D大坝图像进行特征提取,利用两个并行的分层Transformer网络分阶段提取多种分辨率大小的RGB图像特征图和深度图像特征图;将各阶段提取到的两种特征图一起输送到特征校准模块CA‑FCM,利用通道注意力机制对来自两种模态的特征进行相互校准,过滤彼此的噪声信息;将同一级别校准后的特征送入特征融合模块CM‑FFM,基于跨模态注意力机制进一步地完善RGB特征图和深度特征图,并融合成单个特征图;将融合后的特征图由多层感知机组成的解码器进行解码,转换成语义分割图。本发明解决了对RGB‑D大坝缺陷图像特征提取不充分,以及无法有效融合RGB特征图和深度特征图的问题,从而提高了RGB‑D大坝缺陷图像语义分割的精度。
公开/授权文献
- CN118334330B 基于双向跨模态注意力机制的RGB-D大坝缺陷图像语义分割方法 公开/授权日:2024-11-08