多媒体资源分类方法、装置、计算机设备及存储介质

    公开(公告)号:CN109189950B

    公开(公告)日:2023-04-07

    申请号:CN201811023323.7

    申请日:2018-09-03

    IPC分类号: G06F16/43 G06F18/25

    摘要: 本发明公开了一种多媒体资源分类方法、装置、计算机设备及存储介质,属于计算机技术领域。所述方法包括:根据资源分类指令,获取待分类的多媒体资源;调用资源分类模型,所述资源分类模型包括多个资源分类模块,每个资源分类模块对应于一种多媒体资源的分类算法;将所述多媒体资源输入所述资源分类模型中,由所述资源分类模型中的每个资源分类模块分别对所述多媒体资源进行分类,得到多个第一分类结果,基于所述多个第一分类结果输出第二分类结果,所述第二分类结果为所述多媒体资源的至少一个类型。本发明通过一个模型中的多个资源分类模块进行分类,并综合结果,有效提高了多媒体资源分类的准确性。

    自然语言描述信息的生成方法及装置

    公开(公告)号:CN109871736B

    公开(公告)日:2023-01-31

    申请号:CN201811409084.9

    申请日:2018-11-23

    摘要: 本发明公开了一种自然语言描述信息的生成方法及装置。其中,该方法包括:通过多个自然语言描述模型对媒体资源进行处理,得到多个第一特征向量,其中,多个第一特征向量对应多种特征类型,多个自然语言描述模型中每个自然语言描述模型用于根据输入信息生成自然语言描述信息,自然语言描述信息用于通过自然语言表示自然语言描述模型的输入信息;对多个第一特征向量进行融合,得到第二特征向量;根据第二特征向量生成目标自然语言描述信息,其中,目标自然语言描述信息用于通过自然语言表示媒体资源。本发明解决了相关技术中为媒体资源生成的自然语言描述信息对媒体资源描述的准确性较低的技术问题。

    一种图像处理、模型训练、方法、装置和存储介质

    公开(公告)号:CN109934775B

    公开(公告)日:2022-12-27

    申请号:CN201811384682.5

    申请日:2018-11-20

    发明人: 任文琦 马林 刘威

    IPC分类号: G06T5/00 G06N3/04 G06N3/08

    摘要: 本发明实施例公开了一种图像处理、模型训练、方法、装置和存储介质;本发明实施例可以获取待处理模糊图像、以及所述待处理模糊图像对应的模糊核;获取所述模糊核对应的分解矩阵;根据所述分解矩阵对反卷积网络模型中卷积层的参数进行设置,得到设置后反卷积网络模型,所述反卷积网络模型由样本模糊核、样本模糊核的广义矩阵分解结果、样本模糊核对应的样本模糊图像训练而成;所述卷积层与所述分解矩阵对应;根据所述设置后反卷积网络模型对所述待处理模糊图像进行去模糊处理,得到去模糊后图像;该方案可以提升去模糊效率和效果。

    视频描述信息的生成方法、视频处理方法、相应的装置

    公开(公告)号:CN109960747B

    公开(公告)日:2022-12-16

    申请号:CN201910263207.0

    申请日:2019-04-02

    IPC分类号: G06F16/783

    摘要: 本申请实施例提供了一种视频描述信息的生成方法、视频处理方法、相应的装置。该视频描述信息的生成方法包括:获取待描述视频对应的帧级别视频特征序列;根据视频特征序列,生成待描述视频的全局词性序列特征;根据全局词性序列特征及视频特征序列,生成待描述视频的自然语言描述信息,本申请实施例能够有效地从视频数据中提取出自然语言对应的全局词性序列特征,用于引导生成准确的自然语言描述,提高视频描述的能力。

    一种指示对象的检测方法、装置以及相关设备

    公开(公告)号:CN110555337B

    公开(公告)日:2022-12-06

    申请号:CN201810542990.X

    申请日:2018-05-30

    摘要: 本申请实施例公开了一种指示对象的检测方法、装置以及相关设备,其中,该方法包括:获取给定图像和给定自然语句,根据指示对象检测模型,对上述给定图像和给定自然语句进行处理,得到给定自然语句描述的指示对象在给定图像中的位置坐标。上述指示对象检测模型为是以图像和自然语句作为输入,直接以自然语句所描述的指示对象在图像中的位置坐标为输出的端到端的神经网络,该指示对象检测模型是通过端到端训练方式,对整个神经网络的参数进行整体训练优化而得到的模型,该指示对象检测模型具有更好的整体检测性能,因此,利用该指示对象检测模型检测指示对象,能够保证检测结果的准确性。

    视频分类的方法、信息处理的方法以及服务器

    公开(公告)号:CN109508584B

    公开(公告)日:2022-12-02

    申请号:CN201710833668.8

    申请日:2017-09-15

    发明人: 唐永毅 马林 刘威

    摘要: 本申请公开了一种信息处理的方法,包括:获取待处理视频;根据时间特征采样规则对待处理视频进行采样,并获取至少一个视频帧特征序列,时间特征采样规则为时间特征与视频帧特征序列之间的对应关系;通过第一神经网络模型对至少一个视频帧特征序列进行处理,得到每个视频帧特征序列的特征表达结果;通过第二神经网络模型对至少一个视频帧特征序列的特征表达结果进行处理,得到至少一个视频帧特征序列所对应的预测结果,预测结果用于确定待处理视频的类别。本申请还提供一种服务器。本申请在对视频进行分类的过程中,还考虑到视频在时间维度上的特征变化,从而能够更好地表达视频内容,提高视频分类的准确率,提升视频分类的效果。

    文本处理方法及相关装置

    公开(公告)号:CN110532571B

    公开(公告)日:2022-11-18

    申请号:CN201910859507.5

    申请日:2017-09-12

    发明人: 马林 姜文浩 刘威

    摘要: 本申请涉及人工智能技术领域,尤其涉及文本处理方法及相关装置。该方法包括:对文本样本进行分词;针对每个分词,确定该分词的向量,其中,不同分词的向量长度相同;将同一文本样本的分词的向量,输入给预先构建的用于提取文本的全局表示的卷积神经网络,得到该文本样本的全局表示;其中,用于提取文本样本的全局表示的神经网络中包括多个卷积层以及连接在该多个卷积层之后的池化层、且上一层卷积层的指定大小的视野域作为下一层卷积层的输入,该指定大小的视野域包括该上一层卷积层提取的至少两个分词向量的特征。本申请得到的文本样本的全局表示是为了确定与其匹配的图像,从而进行文本样本与图像样本的匹配模型的训练。

    视频处理方法、装置、计算机可读介质及电子设备

    公开(公告)号:CN110209878B

    公开(公告)日:2022-09-20

    申请号:CN201810868629.6

    申请日:2018-08-02

    IPC分类号: G06F16/783

    摘要: 本发明的实施例提供了一种视频处理方法、装置、计算机可读介质及电子设备。该视频处理方法包括:分别提取第一视频的特征和第二视频的特征,得到所述第一视频的第一特征向量和所述第二视频的第二特征向量;基于注意力机制对所述第一特征向量进行处理,得到第三特征向量;基于所述第二特征向量和所述第三特征向量进行双线性匹配,以得到匹配结果;根据所述匹配结果在所述第二视频中定位所述第一视频。本发明实施例的技术方案在视频检索时能够精确定位到视频中的相关片段,并且能够提高视频检索效率,降低了视频检索的难度及视频检索所花费的时间。

    视频动作识别方法、装置和机器设备

    公开(公告)号:CN110163052B

    公开(公告)日:2022-09-09

    申请号:CN201810861147.8

    申请日:2018-08-01

    IPC分类号: G06K9/00 G06K9/62

    摘要: 本发明揭示了一种视频动作识别方法、装置和机器设备。所述方法包括:获取进行动作识别的视频数据;对视频数据在神经网络中进行网络各层的特征抽取中,经由神经网络的网络结构使得视频图像上抽取的空域特征进入双线性层;相邻帧视频图像之间根据空域特征进行双线性层上的双线性相关性运算,获得视频数据中每帧视频图像的时空域特征;通过时空域特征进行视频中动作的分类,获得视频数据的动作识别结果。对于神经网络中网络各层的特征抽取,在双线性层上双线性相关性运算中参数和计算复杂度得到控制,进而在控制复杂度的情况下抽取了时空域特征由此,实现了时域关系上的显式建模,有效提升动作识别的性能。

    图像分类模型训练、图像分类、个性化推荐方法及装置

    公开(公告)号:CN110580482B

    公开(公告)日:2022-04-08

    申请号:CN201910848294.6

    申请日:2017-11-30

    发明人: 顾佳伟 马林 刘威

    摘要: 一种图像分类模型训练及装置、图像分类方法及装置、个性化推荐方法及装置、计算机存储介质及设备,一个实施例的方法包括:提取各样本图像的全局图像特征;根据各样本图像及各样本图像的全局图像特征,确定各样本图像的局部关键区域;提取各样本图像的局部关键区域的图像特征;根据各样本图像的全局图像特征及各样本图像的局部关键区域的图像特征,获取各样本图像分别对应的关联特征;初始化分类模型获得初始分类模型;根据各样本图像的全局图像特征、各样本图像的局部关键区域的图像特征及各样本图像的关联特征,对初始分类模型进行训练,获得训练后的图像分类模型。依据本实施例获得的图像分类模型进行图像分类时,能够提高图像分类准确性。