基于多输出最小二乘支持向量回归的图像超分辨方法

    公开(公告)号:CN103903240B

    公开(公告)日:2016-11-02

    申请号:CN201410140097.6

    申请日:2014-04-09

    Abstract: 本发明公开了一种基于多输出最小二乘支持向量回归的图像超分辨方法,主要解决现有图像分辨率低的问题。其实现步骤为:(1)建立HR亮度图像和LR亮度图像的样本库,并创建LR图像矩阵和HR图像矩阵;(2)根据图像矩阵创建实现3倍放大的训练集和测试集;(3)利用训练集训练多输出最小二乘支持向量回归机预测模型;(4)使用最小二乘支持向量回归预测模型估计测试集中的低分辨率图像矩阵的高分辨率亮度图像;(5)利用图像自相似性对估计的高分辨率亮度图像进行更新,得到最终的高分辨率图像。本发明不仅运行时间短,而且能够有效地提高图像分辨率,可用于改善卫星图像、高清晰电视成像质量。

    从检索图像中筛选有用图像的方法

    公开(公告)号:CN103778227B

    公开(公告)日:2016-11-02

    申请号:CN201410032416.1

    申请日:2014-01-23

    Abstract: 本发明公开了一种从检索图像中筛选有用图像的方法,主要用于解决当前图像检索排序结果准确率低的问题。其主要实现步骤为:(1)提取数据库图像视觉词袋特征和语义属性特征;(2)离线训练学习视觉词袋特征和语义属性的映射字典;(3)根据用户给出待搜索图像,检索得到初始图像排序列表;(4)根据用户给出待搜索图像,分析视觉单词语义重要性;(5)根据用户给出待搜索图像,分析视觉单词上下文重要性;(6)结合视觉单词的语义和上下文重要性,重新计算待排序图像相关性分数,完成对初始结果的重新排序,以供用户筛选出有用的相关图像。本发明明显提高最终图像检索的准确率,可用于图像检索。

    基于多输出最小二乘支持向量回归的图像超分辨方法

    公开(公告)号:CN103903240A

    公开(公告)日:2014-07-02

    申请号:CN201410140097.6

    申请日:2014-04-09

    Abstract: 本发明公开了一种基于多输出最小二乘支持向量回归的图像超分辨方法,主要解决现有图像分辨率低的问题。其实现步骤为:(1)建立HR亮度图像和LR亮度图像的样本库,并创建LR图像矩阵和HR图像矩阵;(2)根据图像矩阵创建实现3倍放大的训练集和测试集;(3)利用训练集训练多输出最小二乘支持向量回归机预测模型;(4)使用最小二乘支持向量回归预测模型估计测试集中的低分辨率图像矩阵的高分辨率亮度图像;(5)利用图像自相似性对估计的高分辨率亮度图像进行更新,得到最终的高分辨率图像。本发明不仅运行时间短,而且能够有效地提高图像分辨率,可用于改善卫星图像、高清晰电视成像质量。

    一种基于残差感知量化和残差掩码建模的多功能舞蹈生成方法

    公开(公告)号:CN119516053A

    公开(公告)日:2025-02-25

    申请号:CN202411534646.8

    申请日:2024-10-31

    Abstract: 本发明公开了一种基于残差感知量化和残差掩码建模的多功能舞蹈生成方法,属于人工智能技术领域,基于MORE框架生成舞蹈,包括如下步骤:引入掩码建模方法,通过掩码建模机制生成舞蹈动作;基于MORE框架的残差感知量化RAQ模块,将舞蹈动作编码为多层离散运动特征,逐层捕捉动作的增量细节和复杂性,获取动作的细节信息;MORE框架通过残差掩模建模RBMM模型,利用双向变压器模型在音乐条件下逐层预测和生成舞蹈动作的序列,将动作的序列信息通过残差掩码建模模块RBMM生成与音乐匹配的舞蹈动作。该方法通过层次化的掩码策略和音乐特征的结合,提升了生成过程的层次化和细致度,优化了生成的舞蹈动作与音乐特征的匹配程度。

    基于特征解耦和交叉对比的视频时序定位方法

    公开(公告)号:CN113887471B

    公开(公告)日:2023-02-10

    申请号:CN202111203078.X

    申请日:2021-10-15

    Abstract: 本发明公开了一种基于特征解耦和交叉对比的视频时序定位方法,主要解决现有技术数据信息挖掘不充分,导致定位结果不精确的问题。其方案为:从公开网站获取视频文本训练集和测试集,提取训练样本的视频特征和文本特征;构建包含特征解耦网络、多模态融合网络、交叉对比网络和定位回归网络的文本视频定位网络;对文本视频定位网络进行训练得到最优的网络参数;将测试集输入训练好的文本视频定位网络中进行文本定位,得到文本在视频中对应的起止时间坐标,完成视频时序定位。本发明深入挖掘了视频的内部信息,得到了更有判别力的视频特征,利用视频文本对之间的关联,提高了定位结果的准确性,可用于电子商务、在线教育、智能监控、视频编辑和制作。

    基于奇异值分解特征增强的少样本目标检测方法

    公开(公告)号:CN113971815A

    公开(公告)日:2022-01-25

    申请号:CN202111266049.8

    申请日:2021-10-28

    Abstract: 本发明提出了一种基于奇异值分解特征增强的少样本目标检测方法,解决了少样本目标检测方法的泛化性和判别性较差的问题。实现包括:获取目标检测图像数据集;对训练样本集图像进行特征提取;构建特征增强模块对提取特征进行增强;RPN模块生成候选框区域并进行RoI对齐;对两种特征图融合形成特征融合层;目标物体的边框定位与分类;对改进后的Faster R‑CNN网络进行训练;对待检测图像进行目标检测。本发明提出了特征增强模块、特征融合层和Lkl损失函数三个部分,学习到图像更本质的特征和在高维空间的判别信息,使特征具有很好的泛化性和判别性,有效提高了少样本目标检测的定位与分类精度,可用于机器人导航、智能视频监控等领域。

    基于特征解耦和交叉对比的视频时序定位方法

    公开(公告)号:CN113887471A

    公开(公告)日:2022-01-04

    申请号:CN202111203078.X

    申请日:2021-10-15

    Abstract: 本发明公开了一种基于特征解耦和交叉对比的视频时序定位方法,主要解决现有技术数据信息挖掘不充分,导致定位结果不精确的问题。其方案为:从公开网站获取视频文本训练集和测试集,提取训练样本的视频特征和文本特征;构建包含特征解耦网络、多模态融合网络、交叉对比网络和定位回归网络的文本视频定位网络;对文本视频定位网络进行训练得到最优的网络参数;将测试集输入训练好的文本视频定位网络中进行文本定位,得到文本在视频中对应的起止时间坐标,完成视频时序定位。本发明深入挖掘了视频的内部信息,得到了更有判别力的视频特征,利用视频文本对之间的关联,提高了定位结果的准确性,可用于电子商务、在线教育、智能监控、视频编辑和制作。

    基于压缩多尺度特征融合网络的图像超分辨率重建方法

    公开(公告)号:CN108537731A

    公开(公告)日:2018-09-14

    申请号:CN201810315128.5

    申请日:2018-04-10

    Abstract: 本发明提出了一种基于压缩多尺度特征融合网络的图像超分辨率重建方法,用于解决现有技术中存在的重建后的高分辨率图像峰值信噪比和结构相似性较低的技术问题。实现步骤为:获取由高低分辨率图像对组成的训练样本集;构建多尺度特征融合网络;对多尺度特征融合网络进行训练;获取压缩多尺度特征融合网络;用压缩多尺度特征融合网络对待重建RGB图像进行超分辨率重建。本发明在多尺度特征融合网络中采用多个依次层叠连接的多尺度特征融合层提取低分辨图像的多尺度特征,并对其进行非线性映射,有利于提高重建后的高分辨率图像峰值信噪比和结构相似性。可用于遥感成像、公共安全、医学诊断等领域。

    一种高光谱图像分类的方法及装置

    公开(公告)号:CN106503727A

    公开(公告)日:2017-03-15

    申请号:CN201610872312.0

    申请日:2016-09-30

    Abstract: 本发明提供了一种高光谱图像分类的方法及装置,该方法,包括:预先从高光谱图像中确定训练样本,为每个所述训练样本设置对应的类标;提取所述高光谱图像的至少两个图像特征;确定每个所述图像特征的最邻近图的相似度矩阵;确定每个相似度矩阵的图拉普拉斯矩阵;将每个所述图拉普拉斯矩阵投射在格拉斯曼流形上,在所述格拉斯曼流形上确定每两个图拉普拉斯矩阵之间的距离;根据所述每两个图拉普拉斯矩阵之间的距离和所述训练样本的类标,确定所述高光谱图像的类标矩阵;根据所述类标矩阵,确定所述高光谱图像的每个样本的类标。本发明提供了一种高光谱图像分类的方法及装置,能够提高分类的准确性。

    基于多特征融合的图像检索方法

    公开(公告)号:CN103810299B

    公开(公告)日:2017-02-15

    申请号:CN201410085211.X

    申请日:2014-03-10

    Abstract: 本发明公开了一种基于图像多特征融合的图像检索方法,主要用于解决现有技术检索图像准确率低的问题。其实现步骤为:(1)提取待检索图像集合中所有图像的三种视觉特征和语义属性特征;(2)计算待检索图像集合中所有图像间邻接距离矩阵;(3)对查询图像在每一种特征通道进行粗检索;(4)根据每一种特征通道的粗检索结果,分析粗检索结果中图像的语义属性特征,选定参考图像;(5)根据选定的参考图像,计算每一种特征融合模板矩阵;(6)根据得到的融合模板矩阵,得到融合后的距离测度矩阵(;7)根据得到的距离测度矩阵,返回给用户检索的结果。本发明明显提高了最终图像检索的准确率,可用于图像检索。

Patent Agency Ranking