基于语义自适应融合的盲图像质量评价方法

    公开(公告)号:CN118411356A

    公开(公告)日:2024-07-30

    申请号:CN202410611201.9

    申请日:2024-05-16

    Abstract: 本发明公开了基于语义自适应融合的盲图像质量评价方法,包括以下步骤;步骤1:将动态激活函数ACON引入到ResNet50中,构建动态特征编码器;步骤2:将语义特征和质量特征融合;将得到的融合特征用于在质量特征编码器中继续进行前向推理;步骤3:利用二阶池化捕捉低级特征中的失真信息;将捕捉到的低级特征中的失真信息与质量特征编码器第四层池化后的全局特征向量拼接成多尺度特征,作为质量分数回归器的输入;步骤4:进行对比实验和消融实验。本发明利用动态激活函数ACON和局部失真模块与特征融合的操作,实现了具有参数自适应能力的动态网络ResNet50‑ACON,构建了低级特征与深度特征互补、语义信息与质量信息融合的多尺度融合特征。

    基于跨模态文本相关注意力的时序语言定位方法

    公开(公告)号:CN116127132B

    公开(公告)日:2025-04-11

    申请号:CN202310199160.2

    申请日:2023-03-03

    Abstract: 本发明公开了一种基于跨模态文本相关注意力的时序语言定位方法,主要解决现有技术在的文本与视频跨模态融合中缺乏语义相关性的问题。其方案为:获取训练数据集和测试数据集,并提取训练数据集的视频及文本特征;构建基于跨模态文本相关注意力的时序语言定位模型,利用文本特征与视频特征进行融合获取融合特征,使用文本语义信息与融合特征注意力的交互,实现视频的时序定位;使用训练数据集的视频及文本特征对时序语言定位模型进行训练;将测试数据集输入到训练好的时序语言定位模型得到跨模态文本相关注意力的时序语言定位结果。本发明能在各种复杂的跨模态视频中检索出丰富的相关特征信息、提高了检索精度,可用于检索视频中对应于文本的片段。

    基于交叉伪监督的医学图像分割方法

    公开(公告)号:CN119785034A

    公开(公告)日:2025-04-08

    申请号:CN202411988517.6

    申请日:2024-12-31

    Abstract: 本发明提出了一种基于交叉伪监督的医学图像分割方法,实现步骤为:获取训练和测试样本集;构建基于强弱扰动一致性的交叉伪监督的医学图像分割网络模型并对其进行迭代训练;获取医学图像分割结果。本发明通过第一支网络对弱扰动后的样本进行强扰动再进行图像级强扰动分割,同时第二支网络对弱扰动后的样本进行特征级强扰动分割,并通过交叉伪监督模块分别计算图像级和特征级强扰动分割子网络的交叉伪监督损失,实现了强弱扰动一致性,避免了现有技术过分依赖弱扰动导致的训练偏差累积的缺陷,能够更好地学习图像中复杂的边缘特征,与现有技术相比,有效提高了分割精度。

    一种基于信息传递VIT的无参考图像质量评价方法

    公开(公告)号:CN119672001A

    公开(公告)日:2025-03-21

    申请号:CN202411760781.4

    申请日:2024-12-03

    Abstract: 本发明公开了一种基于信息传递VIT的无参考图像质量评价方法,包括以下步骤;步骤1:从公开图像质量评价数据集中随机选取图像;图像作为训练样本集B和测试样本集C;步骤2:构建基于信息传递VIT的无参考图像质量评价网络模型S,将所述图像输入无参考图像质量评价网络模型S中,用于预测图像质量分数;步骤3,对基于信息传递VIT的无参考图像质量评价模型进行迭代训练;步骤4,获取图像的无参考质量评价结果,得到图像质量分数。本发明将图像特征信息在各层之间完成交互及整合,并在此基础上预测图像质量分数。

    基于软掩膜对比损失的图像异常检测方法

    公开(公告)号:CN114565594B

    公开(公告)日:2024-11-01

    申请号:CN202210209818.9

    申请日:2022-03-04

    Abstract: 本发明公开了一种基于软掩膜对比损失的图像异常检测方法,主要解决现有技术异常检测种类少,检测精度差的问题。其方案是:利用超像素分割算法与高斯噪声对MVTec数据集进行处理,得到合成图像训练数据集;搭建由重建自编码器和掩膜自编码器组成的异常检测模型,并使用L2误差损失作为掩膜自编码器的损失函数,使用L2误差损失与软掩膜对比损失作为重建自编码器的损失函数;利用合成图像训练数据集对其掩膜编码器和重建自编码器进行交替训练,直至各自的损失函数收敛;将测试图像输入到训练好的图像异常检测模型,得到图像异常检测与定位的结果。本发明异常识别种类多,检测精度高,可用于工业品瑕疵检测、医疗辅助诊断、视频违规行为检测。

Patent Agency Ranking