-
公开(公告)号:CN116596915A
公开(公告)日:2023-08-15
申请号:CN202310684778.8
申请日:2023-06-09
申请人: 西安电子科技大学 , 西安电子科技大学杭州研究院
IPC分类号: G06T7/00 , G06V10/80 , G06V10/774 , G06V10/82
摘要: 基于多尺度特征和长距离依赖的盲图像质量评价方法,包括以下步骤;步骤1,获取训练样本集和测试样本集;步骤2,构建基于多尺度特征和长距离依赖关系的无参考图像质量评价方法网络模型;用于提取和融合图像的多尺度特征和长距离依赖关系以回归到图像质量分数;步骤3,对基于多尺度特征和长距离依赖关系的无参考图像质量评价方法网络模型进行迭代训练;步骤4,获取图像的无参考质量评价结果。本发明用于解决现有方法参数量大、计算效率低的问题和现有方法忽略对多尺度特征和局部质量特征之间的长距离依赖关系的融合而导致模型预测结果与人类视觉感知一致性低的问题。
-
公开(公告)号:CN114882055B
公开(公告)日:2024-10-25
申请号:CN202210604865.3
申请日:2022-05-30
申请人: 西安电子科技大学
摘要: 本发明提出了一种基于多方向梯度算子的遥感图像脊线标注方法,用于解决现有技术中遥感图像拓扑结构复杂以及脊线分叉时标注效果不佳的问题。实现步骤为:对遥感图像进行平滑处理;生成3个方向的梯度算子;利用多方向梯度算子生成脊线图;在树状图中存储脊线的路径信息;重构树状图的组织结构;用重构后树状图中的信息进行脊线标注。本发明采用多方向梯度算子获取遥感图像中脊线的明暗空间梯度特征,以树状图存储脊线的位置信息,使得本发明具有面对复杂遥感图像拓扑结构时脊线标注效果好的优点。
-
公开(公告)号:CN116721076A
公开(公告)日:2023-09-08
申请号:CN202310676736.X
申请日:2023-06-08
申请人: 西安电子科技大学
IPC分类号: G06T7/00 , G06F18/00 , G06F18/10 , G06F18/21 , G06N3/0464 , G06N3/082 , G06N3/084 , A61B5/378 , A61B5/00
摘要: 本发明公开了一种基于图像内容和图像失真感知顺序的图像质量评价方法,包括以下步骤;步骤1:图像选取与失真处理;得到原始风景图像集、原始人物图像集、失真风景图像集、失真人物图像集,作为受试者观看的图像刺激;步骤2:脑电信号采集实验;采集受试者在观看不同内容和不同失真情况的图像刺激时产生的脑电信号;步骤3:脑电信号预处理;用于对步骤2采集的脑电信号进行处理,以实现数据清洗和数据变换。步骤4:构建并训练脑电信号质量评价网络。本发明能够构建并训练脑电信号质量评价网络,获取脑电信号所对应的图像的质量预测分数。
-
公开(公告)号:CN116468672A
公开(公告)日:2023-07-21
申请号:CN202310292376.3
申请日:2023-03-23
申请人: 西安电子科技大学
IPC分类号: G06T7/00 , G06V10/52 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明公开了基于自适应特征加权融合的无参考图像质量评价方法,包括以下步骤;构建测试集与训练集;构建基础特征提取模块,将训练集中的失真图像输入该模块;在基础特征提取模块后顺次连接逐层多尺度特征融合模块,将基础特征提取模块的输出作为逐层多尺度特征融合模块的输入;在逐层多尺度特征融合模块后顺次连接多粒度特征拼接模块,将基础特征提取模块和逐层多尺度特征融合模块的输出作为多粒度特征拼接模块的输入;对所述的模块所组成的基于自适应特征加权融合的图像质量评价网络S进行迭代训练。本发明利用特征逐层融合方法将相邻尺度的特征图逐层融合,设置有自适应性的相邻特征图融合权重,增强融合后特征图对于多尺度特征的表征能力。
-
公开(公告)号:CN118470399A
公开(公告)日:2024-08-09
申请号:CN202410575982.0
申请日:2024-05-10
申请人: 西安电子科技大学
IPC分类号: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06V10/42 , G06V10/80
摘要: 基于依赖关系先验知识感知的多尺度目标检测方法,包括以下步骤:步骤1,获取训练样本集B和测试样本集C,训练样本集B用于对模型进行训练,测试样本集C用于验证模型效果;步骤2,构建基于依赖关系先验知识感知的图推理网络模型S;步骤3,对基于依赖关系先验知识感知的图推理网络模型S进行迭代训练,得到训练好的基于依赖关系先验知识感知的图推理网络模型S*;步骤4,获取图像的目标检测结果:将测试样本集C作为训练完成的基于依赖关系先验知识感知的图推理网络模型S*的输入进行前向推理,得到每个测试样本的目标检测结果,以验证模型效果。本发明用于解决现有技术因忽视目标间可能的语义关联性和空间位置关系而导致的模型预测准确性较低的问题。
-
公开(公告)号:CN116168011A
公开(公告)日:2023-05-26
申请号:CN202310256035.0
申请日:2023-03-16
申请人: 西安电子科技大学
IPC分类号: G06T7/00 , G06N3/08 , G06N3/0464
摘要: 基于多粒度网络的无参考图像质量评价方法,包括以下步骤;步骤1,获取训练样本集B和测试样本集C:步骤2,构建基于多粒度网络的无参考图像质量评价网络模型S:步骤3,对基于多粒度网络的无参考图像质量评价网络模型S进行迭代训练,得到训练好的基于多粒度网络的无参考图像质量评价网络模型S*;步骤4,获取图像的无参考质量评价结果:将测试样本集C作为训练完成的基于多粒度网络的无参考图像质量评价网络模型S*的输入进行前向推理,得到每个测试样本的质量预测分数,以验证模型效果。本发明通过分析不同粒度的图像块中包含的丰富局部特征,实现图像的无参考质量评价与分析评价。
-
公开(公告)号:CN118470301A
公开(公告)日:2024-08-09
申请号:CN202410606743.7
申请日:2024-05-16
申请人: 西安电子科技大学
IPC分类号: G06V10/25 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06F18/25 , G06T7/50 , G06N3/0475
摘要: 基于深度信息场景图生成的多尺度目标检测方法,包括以下步骤;步骤1,获取Visual Genome数据集;步骤2,构建融合深度信息的多模态场景图生成网络S,将深度信息引入场景图的生成过程,以避免视觉错位效应对谓词预测的干扰;步骤3,对融合深度信息的多模态场景图生成网络S进行场景图生成实验,得到该网络在Visual Genome数据集下的场景图生成任务性能指标。本发明使得目标间依赖关系更好的辅助多尺度目标检测任务,用于解决复杂场景下对于主题目标和客体目标的谓词预测不准确的问题。
-
公开(公告)号:CN116794680A
公开(公告)日:2023-09-22
申请号:CN202310759265.9
申请日:2023-06-26
申请人: 西安电子科技大学
摘要: 基于反射强度信息引导机制的对数球坐标3D目标检测方法,包括以下步骤;步骤1:使用激光雷达设备采集道路点云数据;步骤2:将点云数据和目标边界框的坐标表示由三维直角坐标系转换为对数球坐标系;步骤3:将空间按照对数球坐标进行体素划分并对每个体素进行特征编码,得到体素特征图;步骤4;将体素特征图输入基于反射强度信息引导机制的3D目标检测网络;步骤5:训练基于反射强度信息引导机制的3D目标检测网络;将训练完成的基于反射强度信息引导机制的3D目标检测网络用于3D目标数据集的测试,得到该网络的性能指标。本发明实现每个体素中点云数量的均衡化,提高点云空间特征的利用率和特征提取的效率。能够有效提升体素特征的表征能力。
-
公开(公告)号:CN116468692A
公开(公告)日:2023-07-21
申请号:CN202310421993.9
申请日:2023-04-19
申请人: 西安电子科技大学
IPC分类号: G06T7/00 , A61B5/378 , A61B5/372 , A61B5/00 , G06V10/774 , G06V10/764 , G06N3/0464 , G06N3/08
摘要: 基于脑电信号和结构不确定性的图像质量评价方法,包括以下步骤;步骤1:根据结构不确定值计算公式和图像刺激选取原则,选取出具有不同结构不确定性的图像,选取多张图像构成图像集;步骤2:对图像集中的图像进行不同等级的失真处理,进行恰可察觉失真获取实验,得到不同结构不确定性图像的平均恰可察觉失真;步骤3:进行脑电信号采集实验,选取图像恰可察觉失真所对应的质量等级对图像刺激进行失真处理,采集受试者观看不同质量等级下的不同结构不确定性的图像刺激所产生的脑电信号;步骤4:对脑电信号进行预处理;步骤5:构建并训练脑电信号质量评价网络,获取脑电信号所对应的图像的质量预测分数。该评价方法预测结果准确度高。
-
公开(公告)号:CN116340570A
公开(公告)日:2023-06-27
申请号:CN202310292407.5
申请日:2023-03-23
申请人: 西安电子科技大学
IPC分类号: G06F16/78 , G06F16/783 , G06V10/52 , G06V10/62 , G06V10/80 , G06V30/186 , G06V30/19
摘要: 本发明公开了一种基于时空域信息交互的视频时刻检索方法,包括以下步骤;获取原始的视频集和查询语句集;构建视频特征预提取模块;构建文本特征预提取模块,得到文本特征;利用视频特征进行多尺度变换,生成多尺度视频特征;利用文本特征进行多尺度的特征提取,生成多尺度文本特征;构建多尺度特征交互模块,生成多尺度交互特征;构建时空域信息融合模块,得到时空域信息特征:构建时刻定位模块,得到最终的起始时间和结束时间:对基于时空域信息交互的视频时刻检索模型进行训练;使用训练完成的基于时空域信息交互的视频时刻检索模型对测试集中的视频和文本对进行实验。本发明能够达到提高视频时刻检索的准确性。
-
-
-
-
-
-
-
-
-