基于首因-修正机制的无参考图像质量评价方法

    公开(公告)号:CN118469940A

    公开(公告)日:2024-08-09

    申请号:CN202410575987.3

    申请日:2024-05-10

    IPC分类号: G06T7/00 G06V10/42 G06V10/774

    摘要: 本发明公开了基于首因‑修正机制的无参考图像质量评价方法,包括以下步骤;步骤1,获取训练样本集B和测试样本集C,步骤2,构建基于首因‑修正机制的无参考图像质量评价网络模型S,步骤3,对基于首因‑修正机制的无参考图像质量评价网络模型S进行迭代训练,得到训练好的基于首因‑修正机制的无参考图像质量评价网络模型S*;步骤4,获取图像的无参考质量评价结果:本发明用于解决现有技术因忽视图像首因信息而导致的模型预测质量不符合人类视觉感知特性的问题。

    基于状态信息分离的胸部X光影像报告生成方法

    公开(公告)号:CN118447993A

    公开(公告)日:2024-08-06

    申请号:CN202410645444.4

    申请日:2024-05-23

    IPC分类号: G16H15/00 G16H30/00 G16H30/20

    摘要: 本发明提出了一种基于状态信息分离知识图谱增强的胸部X光影像报告生成方法,实现步骤为:获取训练和测试样本集;构建基于状态信息分离知识图谱增强的胸部X光影像报告生成网络模型并对其进行迭代训练;获取胸部X光影像报告生成结果。本发明在对胸部X光影像报告生成网络模型进行训练和胸部X光影像报告生成结果的过程中,分离子图生成模块通过三元组构建异常子图和正常子图,利用两个状态信息分离的子图分别学习异常信息和正常信息内部的关系,避免了现有技术因不同状态信息混杂导致的相互干扰,减小了模型需要学习知识与生成的报告之间的差异,从而提高了生成报告的准确性。

    一种利用日常行为数据的大学生心理危机预警方法

    公开(公告)号:CN118280589A

    公开(公告)日:2024-07-02

    申请号:CN202410473225.2

    申请日:2024-04-19

    摘要: 本发明提出了一种利用日常行为数据的大学生心理危机预警方法,实现步骤为:获取训练样本集和测试样本集;构建基于交叉网络的心理危机预警模型;对心理危机预警模型进行迭代训练;获取心理危机预警结果。本发明在对心理危机预警模型进行训练以及获取评估结果的过程中,交叉网络通过对输入的特征向量进行逐元素相乘,能够深入挖掘不同特征间的交互关系,并通过全连接神经网络的多次非线性运算,隐式地生成特征间的交互信息,提高了预测的准确性;同时本发明使用的有自适应权重的交叉熵损失函数,通过调整不同类别样本的权重,降低了易分类样本的权重,使得模型能够更多地关注那些难以分类但更为关键的样本,从而提高了模型的预测精度和泛化能力。

    基于动态树形门控网络的模块化持续学习方法

    公开(公告)号:CN118153665A

    公开(公告)日:2024-06-07

    申请号:CN202410296455.6

    申请日:2024-03-15

    摘要: 本发明公开了一种基于动态树门控网络的高效模块化持续学习方法,主要解决现有技术计算资源浪费,模块复用率低及灾难性遗忘的问题。其实现方案是:1)获取任务流训练集;2)设计包含功能组件及树形门控组件的模型网络并定义其损失函数;3)将任务流训练集输入到模型网络中对其进行训练:3a)利用树形门控组件和功能组件产生模块的任务特征,将若干模块求和得到模型网络的输出;3b)计算模型网络损失函数和梯度,更新模型网络参数;3c)单一任务训练结束后,冻结模型网络参数;重复3a)‑3c)直至任务流训练集结束,获得训练好的模型网络。本发明能克服灾难性遗忘,提升模块复用率,节约计算资源,可用于机器人学习,医疗诊断与辅助治疗。

    基于提示增强和稀疏注意力的视频问答方法

    公开(公告)号:CN117649628A

    公开(公告)日:2024-03-05

    申请号:CN202311681462.X

    申请日:2023-12-08

    摘要: 本发明公开了基于提示增强和稀疏注意力的视频问答方法,包括以下步骤;步骤1:使用预训练CLIP模型进行特征提取和提示构建;步骤2:输入步骤1提取的特征,构建概率稀疏自注意力PSSA提取视频关键特征;步骤3:通过步骤2提取的视频关键特征,融合视频特征与文本提示,通过融合特征与候选答案特征的相似度判断答案。本发明利用预训练的CLIP模型的强大的视觉文本泛化能力,以解决视频文本预训练的成本问题。通过充分利用CLIP对比学习的特性,考虑概率稀疏自注意力和视觉语言交叉注意力,以有效地消除视频特征中的冗余信息。

    基于层次语义结构的跨模态哈希检索方法

    公开(公告)号:CN113806580B

    公开(公告)日:2023-10-20

    申请号:CN202111140203.7

    申请日:2021-09-28

    摘要: 本发明公开了一种基于层次语义结构的跨模态哈希检索方法,其步骤为:(1)建立数据集;(2)构建图像和文本特征提取网络;(3)利用层次语义结构生成损失函数;(4)训练图像和文本特征提取网络;(5)用户用图像检索文本;(6)用户用文本检索图像。本发明通过将图像文本对标签中每层的所有类别的类哈希码扩展为对应层次的层次语义结构,将各层的层次语义结构融合到哈希码中,使得图像文本对的哈希码很大程度地保留了标签的同层与层间的关联信息,解决了现有跨模态哈希检索方法忽略层间关系导致标签信息不全面的问题和将标签信息融合到图像特征和文本特征中导致哈希码损失了部分语义信息的问题。

    基于级联式特征注意力金字塔网络的自然图像去散光方法

    公开(公告)号:CN116757943A

    公开(公告)日:2023-09-15

    申请号:CN202310564192.8

    申请日:2023-05-18

    摘要: 本发明提出一种基于级联式特征注意力金字塔空间网络的图像去散光方法,采用生成对抗网络架构,构建构造了级联式特征注意力金字塔网络,克服了现有技术中在对噪声不同强度与种类图像修复时,由于特征提取鲁棒性差导致图像修复效果差的不足的问题,提高了噪声消除的鲁棒性。本发明在级联式特征注意力金字塔网络结构中引入了注意力机制,通过降低由于噪声杂乱带来图像修复时关注区域的不确定性,进而减少了修复噪声给自然图像带来的模糊效果,提升自然图像的修复质量。此外,本发明填补了现有技术仅关注雨水痕迹、雾霾模糊和阴影遮挡等常见噪声的不足,扩展了图像去噪修复应用的应用场景。

    一种基于异形三维卷积的球坐标下3D目标检测方法

    公开(公告)号:CN116665202A

    公开(公告)日:2023-08-29

    申请号:CN202310657204.1

    申请日:2023-06-05

    摘要: 一种基于异形三维卷积的球坐标下3D目标检测方法,包括以下步骤;步骤1:获取原始点云数据;步骤2:将接收到的原始点云数据和目标边界框的坐标由三维直角坐标系转换为球坐标系;步骤3:将空间按照球坐标进行体素划分,将稀疏点云数据转换为稠密点云数据;步骤4:对每个体素进行体素特征编码,得到体素特征图;步骤5:对体素特征图利用异形三维卷积进行空间特征提取,得到密集特征图矩阵;步骤6:构建基于异形三维卷积的3D目标检测网络S;步骤7:对基于异形三维卷积的3D目标检测网络S进行训练。本发明利用异形三维卷积模块代替常用的对称卷积层进行体素空间特征的提取,获得体素的高维空间特征。该方法能有效降低3D卷积层计算量。