基于逆扩散模型的多模态图像融合方法、系统、设备及可读存储介质

    公开(公告)号:CN120070202A

    公开(公告)日:2025-05-30

    申请号:CN202510124896.2

    申请日:2025-01-27

    Abstract: 本发明涉及一种逆扩散模型的多模态图像融合方法,包括以下步骤:步骤一、利用逆扩散技术,将可见光图像逆转至噪声潜在空间,然后利用逆转后的可见光图像特征,引导红外图像进行逆转;步骤二、通过扩散模型中的逆过程进行引导,将可见光的外观属性的注入红外特征,其特征可生成具有可见光风格的红外图像;步骤三、设计特定的融合规则,用于去噪过程中的注意层融合逆转的可见光和红外特征,保留模型的文本交互能力,支持语言驱动的融合控制。本发明无需额外训练或微调,即可直接生成高质量的融合图像。得到的融合图像与基础模型高度兼容,有效解决了数据域间的差异问题,并显著提升了下游机器感知任务的表现。本发明显著降低了训练成本,为跨域任务提供了高效且创新的解决方案。

Patent Agency Ranking