一种基于对应的深层信念网络的跨模态检索方法

    公开(公告)号:CN104462485B

    公开(公告)日:2017-12-05

    申请号:CN201410797791.5

    申请日:2014-12-18

    IPC分类号: G06F17/30

    摘要: 本发明提出了一种基于对应的深层信念网络的跨模态检索方法,该方法包括:利用特征提取方法分别获得检索目标与检索库中每一个检索成员的初级向量;检索目标的初级向量分别与检索库中每一个检索成员的初级向量,通过对应的深层信念网络获得检索目标的高级向量和检索库中每一个检索成员的高级向量;利用检索目标的高级向量和检索库中每一个检索成员的高级向量计算检索目标与检索库中每一个检索成员的距离;将检索库中与检索目标距离最近的至少一个检索成员确定为与检索目标匹配的对象。

    一种基于美学的图像裁剪方法及装置

    公开(公告)号:CN109146892B

    公开(公告)日:2020-06-19

    申请号:CN201810813038.9

    申请日:2018-07-23

    IPC分类号: G06T7/11

    摘要: 本申请实施例提供了一种基于美学的图像裁剪方法及装置,属于计算机技术领域。所述方法包括:获取待裁剪图像;根据显著性检测算法,计算所述待裁剪图像对应的显著图,其中,所述显著图包括所述待裁剪图像对应的显著度图像,所述显著度图像是灰度图像;通过显著区域提取算法,在所述显著图中确定显著边界框;在所述待裁剪图像中,确定所述显著边界框对应的显著区域,其中,所述显著区域为所述待裁剪图像中所述显著边界框包含的图像区域;根据美学区域识别算法和所述显著区域,确定包含所述显著区域的美学区域边界框;基于所述美学区域边界框,对所述待裁剪图像进行裁剪,得到目标图像。采用本发明,可以提高确定裁剪框的效率。

    基于采集搜索引擎数据的隐私信息评级方法

    公开(公告)号:CN104216983B

    公开(公告)日:2019-03-01

    申请号:CN201410441434.5

    申请日:2014-09-01

    IPC分类号: G06F16/95 G06F21/60

    摘要: 本发明公开了一种基于采集搜索引擎数据的隐私信息评级方法,包括以下步骤:第一步从搜索引擎采集数据确定每个隐私信息的普遍性分值U,第二步从搜索引擎采集数据确定每个隐私信息的敏感性分值S,第三步根据U×S计算结果确定隐私信息的安全等级。本发明提供的评级方法使用的数据从搜索引擎采集,数据来源于使用搜索引擎的庞大的用户群,因此评级结果不依赖于个人的经验或意见,评级结果具有公正性;同时本发明提供的隐私信息评级方法不针对特定的隐私内容,既可以评定全体隐私信息,也可用于评定应用系统中有限数量的隐私信息。

    一种使用深层结构获取双模态相似性测度的方法

    公开(公告)号:CN103793507B

    公开(公告)日:2016-10-05

    申请号:CN201410039222.4

    申请日:2014-01-26

    IPC分类号: G06F17/30 G06N3/08

    摘要: 本发明提出了一种使用深层结构获取双模态相似性测度的方法,该方法包括:第一模态原始数据使用经典特征提取方法获取第一模态的低级表达P1,第二模态原始数据使用经典特征提取方法获取第二模态的低级表达T1,P1为n维向量,T1为l维向量;第一模态的低级表达P1通过堆叠的两层受限波尔兹曼机获得中级表达P3;第二模态的低级表达T1通过堆叠的两层受限波尔兹曼机获得中级表达T3;所述第一模态的中级表达P3与第二模态的中级表达T3分别使用自动编码器进行编码,编码后第一模态表示为P4,第二模态表示为T4,所述P4与T4为相同维数的向量,计算P4与T4的相似性测度。

    一种基于自动编码器的视频分类方法及装置

    公开(公告)号:CN104866596A

    公开(公告)日:2015-08-26

    申请号:CN201510290451.8

    申请日:2015-05-29

    IPC分类号: G06F17/30 G06K9/62

    CPC分类号: G06F17/30781 G06K9/6267

    摘要: 本发明实施例提供了一种基于自动编码器的视频分类方法及装置。该方法中,获得具有三种模态数据的目标视频的每一种模态数据的低级表示内容;将每一种模态数据的低级表示内容分别输入至堆叠的自动编码器组处理,获得每一种模态数据的高级表示内容;将每两种模态数据的高级表示内容的组合结果分别输入至双模态融合器处理,获得相应两种模态数据的双模态公共表示内容;将双模态公共表示内容的组合结果输入至三模态融合器处理,获得三模态公共表示内容;将三模态公共表示内容输入至有监督分类模型处理,以获得各个视频类别的类别标签,并确定目标视频所对应的视频类别。可见,通过本方案可以结合目标视频的三种模态数据对目标视频进行分类。

    一种基于深层模型的跨模态检索方法

    公开(公告)号:CN104462489A

    公开(公告)日:2015-03-25

    申请号:CN201410800393.4

    申请日:2014-12-18

    IPC分类号: G06F17/30 G06N3/02

    摘要: 本发明提出了一种基于深层模型的跨模态检索方法,该方法包括:利用特征提取方法分别获得目标检索模态与检索库中每一个被检索模态的低级表达向量;目标检索模态的低级表达向量分别与检索库中每一个被检索模态的低级表达向量,通过堆叠对应的受限波尔兹曼机Corr-RBMs深层模型获得目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量;利用目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量计算目标检索模态与检索库中每一个被检索模态的距离;将检索库中与目标检索模态距离最近的至少一个被检索模态确定为与目标检索模态匹配的对象。

    一种图像色彩和谐程度的评估方法及装置

    公开(公告)号:CN108492294B

    公开(公告)日:2022-04-12

    申请号:CN201810247248.6

    申请日:2018-03-23

    IPC分类号: G06T7/00

    摘要: 本发明实施例提供了一种图像色彩和谐程度的评估方法及装置,其中方法包括:通过预设的无向图建立初始条件随机场;根据预设样本图像和预设训练算法,对初始神经网络进行训练;利用训练后的神经网络确定初始条件随机场的关联势函数及交互势函数;根据关联势函数和所述交互势函数,确定初始条件随机场对应的条件随机场模型;当获取到待评估图像时,将待评估图像切分为多个图像块并输入至条件随机场模型,计算得到待评估图像的色彩和谐评估值。本发明实施例提供的图像色彩和谐程度的评估方法,无需人工评估即可计算得到对应的色彩和谐评估值,从而实现自动对图像的色彩和谐程度进行评估。

    一种基于深层模型的跨模态检索方法

    公开(公告)号:CN104462489B

    公开(公告)日:2018-02-23

    申请号:CN201410800393.4

    申请日:2014-12-18

    IPC分类号: G06F17/30 G06N3/02

    摘要: 本发明提出了一种基于深层模型的跨模态检索方法,该方法包括:利用特征提取方法分别获得目标检索模态与检索库中每一个被检索模态的低级表达向量;目标检索模态的低级表达向量分别与检索库中每一个被检索模态的低级表达向量,通过堆叠对应的受限波尔兹曼机Corr‑RBMs深层模型获得目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量;利用目标检索模态的高级表达向量和检索库中每一个被检索模态的高级表达向量计算目标检索模态与检索库中每一个被检索模态的距离;将检索库中与目标检索模态距离最近的至少一个被检索模态确定为与目标检索模态匹配的对象。

    一种图像检索方法
    9.
    发明授权

    公开(公告)号:CN103678660B

    公开(公告)日:2017-01-11

    申请号:CN201310722183.3

    申请日:2013-12-24

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种图像检索方法,首先计算图像数据库中任意两个图像的内点数,根据公式计算任意两个图像的相关度值;然后计算查询目标与图像数据库中任一图像的相关度值,得到与查询目标直接相关的图像与间接相关的图像;构建一个赋权邻接矩阵A进行衰减,且增加弥补衰减过度造成间接相关度值过小的补给项计算查询目标vq与图像vi的间接相关度值,并通过迭代调整所述间接相关度值使得相关度值越高的图像与查询目标vq的间接相关度值越大;将查询目标与图像数据库各图像的直接相关度和间接相关度进行排序,得到图像数据库中包含查询目标的图像。

    一种三维注册方法及装置
    10.
    发明公开

    公开(公告)号:CN105005986A

    公开(公告)日:2015-10-28

    申请号:CN201510347373.0

    申请日:2015-06-19

    IPC分类号: G06T7/00

    摘要: 本发明实施例公开了一种三维注册方法及装置。一种三维注册方法,应用于具有陀螺仪及摄像头的终端,所述摄像头用于拍摄包含标志物的真实场景的图像,所述标志物放置于任一平面上,所述方法包括以下步骤:读取所述陀螺仪的角度信息,并根据读取的陀螺仪的角度信息,确定预先建立的世界坐标系到当前时刻的摄像机坐标系的旋转矩阵RWC;确定所述标志物坐标系到所述摄像机坐标系的旋转矩阵RMC;确定所述标志物坐标系到所述摄像机坐标系的平移向量TMC;根据确定的RMC和确定的TMC,进行三维注册。应用本发明实施例所提供的技术方案,提高了三维注册过程中旋转矩阵求解的鲁棒性与精度,使得虚拟对象与真实场景的叠加达到较好的融合效果。