-
公开(公告)号:CN118298431B
公开(公告)日:2024-08-13
申请号:CN202410718322.3
申请日:2024-06-05
Applicant: 安徽农业大学
IPC: G06V20/70 , G06V10/82 , G06V10/44 , G06V10/50 , G06V10/52 , G06V10/80 , G06V10/762 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06F40/30 , G06F40/284 , G06F18/25
Abstract: 本发明公开了一种自然场景图像描述生成方法及系统,属于计算机视觉以及自然语言处理技术领域。本发明采用融合注意力机制的编码器‑解码器架构设计图像描述模型,构建基于向量梯度非均匀正则化的图像特征编码模块,增强图像中目标之间互动关系的准确性;构建基于特征贡献和标准差控制优化的文本特征解码模块,提高捕捉图像视觉信息的完整性和图像描述技术在各种场景下的泛化能力和适应性。本发明能够提升面向自然场景的图像描述的准确性、多样性和通用性,从而生成高精度、信息丰富和鲁棒性强的自然语言描述。
-
公开(公告)号:CN118298431A
公开(公告)日:2024-07-05
申请号:CN202410718322.3
申请日:2024-06-05
Applicant: 安徽农业大学
IPC: G06V20/70 , G06V10/82 , G06V10/44 , G06V10/50 , G06V10/52 , G06V10/80 , G06V10/762 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06F40/30 , G06F40/284 , G06F18/25
Abstract: 本发明公开了一种自然场景图像描述生成方法及系统,属于计算机视觉以及自然语言处理技术领域。本发明采用融合注意力机制的编码器‑解码器架构设计图像描述模型,构建基于向量梯度非均匀正则化的图像特征编码模块,增强图像中目标之间互动关系的准确性;构建基于特征贡献和标准差控制优化的文本特征解码模块,提高捕捉图像视觉信息的完整性和图像描述技术在各种场景下的泛化能力和适应性。本发明能够提升面向自然场景的图像描述的准确性、多样性和通用性,从而生成高精度、信息丰富和鲁棒性强的自然语言描述。
-