-
公开(公告)号:CN108288067A
公开(公告)日:2018-07-17
申请号:CN201710817344.5
申请日:2017-09-12
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请涉及人工智能技术领域,尤其涉及图像文本匹配模型的训练方法、双向搜索方法及相关装置。该训练方法包括:提取图像样本和文本样本的全局表示和局部表示,后训练预先构建的匹配模型,该匹配模型将图像样本和文本样本各自的全局表示和局部表示映射到指定语义空间,全局表示的相似度和局部表示的相似度;并,根据全局表示的相似度的预设权值,以及局部表示的相似度的预设权值,采用加权求和的方式,确定图像和文本的匹配度。本申请得到的匹配度是基于将图像的细节特征到全局特征都考量在内,得到的匹配度更加准确和全面。
-
公开(公告)号:CN109885723B
公开(公告)日:2023-10-13
申请号:CN201910126750.6
申请日:2019-02-20
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F16/70 , G06N3/0464 , G06N3/042
摘要: 本发明公开了一种视频动态缩略图的生成方法,包括:获取待处理文本以及待处理视频,待处理文本包括N个词语,待处理视频包括T个片段,每个片段包括多帧图像,N为大于1的整数,T为大于1的整数;对待处理文本进行编码得到文本编码特征集合,对待处理视频进行编码得到视频编码特征集合;根据文本编码特征集合以及视频编码特征集合,获取交互特征集合;根据交互特征集合获取图卷积视频特征集合;通过时序条件指针网络生成图卷积视频特征集合所对应的至少一个目标片段。本发明还公开了一种模型训练的方法及装置。本发明能够提升搜索的灵活度和广泛性,其表现力和所包含的视频内容更容易满足用户对于视频内容概览的诉求。
-
公开(公告)号:CN110298302B
公开(公告)日:2023-09-08
申请号:CN201910566084.8
申请日:2019-06-25
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V40/10 , G06V40/20 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/09
摘要: 本发明实施例公开了一种人体目标检测方法及相关设备,包括:首先从多张成像图像中获取样本图像,该样本图像中包括包含人体头部区域、可视人体区域以及全身人体区域在内的人体所在区域;接着根据人体所在区域确定样本图像的模型训练信息;然后将样本图像和模型训练信息输入待训练模型进行训练,得到人体目标检测模型;最后根据人体目标检测模型,确定待检测图像中的人体头部区域、可视人体区域以及全身人体区域。采用本发明实施例,可以提高有遮挡的人体目标的检测效果、以及全身人体位置检测的准确性。
-
公开(公告)号:CN110135336B
公开(公告)日:2023-08-25
申请号:CN201910398152.4
申请日:2019-05-14
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V40/10 , G06V40/20 , G06F40/30 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/044 , G06N3/0475 , G06N3/084 , G06N3/094
摘要: 本申请是关于一种行人生成模型的训练方法。该方法包括:获取训练数据,所述训练数据包括真实行人图像和第一自然语言描述信息;根据所述训练数据以及目标行人姿态信息训练行人生成对抗网络,所述行人生成对抗网络包括行人生成网络和行人判别网络;将训练后的所述行人生成网络获取为行人生成模型。本申请通过真实行人图像及其自然语言描述,结合目标行人姿态,通过生成对抗网络进行对抗训练,获得行人生成模型,由于在此过程中学习了对行人图像的自然语言描述,后续行人生成模型可以生成更多的对应某一自然语言描述的行人图像,从而扩展基于自然语言进行行人识别的训练数据,以提高后续训练出行人识别模型的准确性。
-
公开(公告)号:CN110215706B
公开(公告)日:2023-05-30
申请号:CN201910538136.0
申请日:2019-06-20
申请人: 腾讯科技(深圳)有限公司
IPC分类号: A63F13/5372 , A63F13/5378 , A63F13/79
摘要: 本申请实施例提供一种虚拟对象的位置确定方法、装置、终端及存储介质。该方法包括:获取目标虚拟对象对应的角色模板;获取目标视频,目标视频中存在第一图像,第一图像包括全局地图,全局地图用于显示虚拟场景的缩略图;在全局地图中查找与角色模板匹配的目标搜索子区域;将目标搜索子区域在全局地图中的位置确定为目标虚拟对象在全局地图中的位置。本申请实施例提供的技术方案,解决了相关技术中无法定位未出现在第一帧图像中的虚拟对象的位置的问题,可以准确定位出游戏视频中的每个虚拟对象在全局地图中的位置,提高了虚拟对象的定位精度。
-
公开(公告)号:CN110163401B
公开(公告)日:2023-05-26
申请号:CN201810146876.5
申请日:2018-02-12
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06Q10/04
摘要: 本发明实施例公开了时间序列的预测方法、数据预测方法和装置,用于提高对时间序列的预测准确度。其中,在时间序列的预测方法中,首先通过对至少一个外部时间序列的特征信息提取,可以得到特征信息序列,然后通过特征信息序列获取到表达信息序列,使用分层注意力机制逐层筛选出与主时间序列相关的相关信息序列,最后结合相关信息序列以及历史时刻的主时间序列,使用时间序列预测模型可以得到在当前时刻的主时间序列预测值。
-
公开(公告)号:CN109299315B
公开(公告)日:2023-03-28
申请号:CN201811022608.9
申请日:2018-09-03
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F16/635 , G06F16/48 , G06F16/65
摘要: 本发明公开了一种多媒体资源分类方法、装置、计算机设备及存储介质,属于计算机技术领域。所述方法包括:获取多媒体资源,提取多媒体资源的多个特征信息;对多个特征信息进行聚类,得到至少一个聚类集合,确定每个聚类集合的聚类描述信息,每个聚类集合包括至少一个特征信息,每个聚类描述信息用于指示一个聚类集合的特征;基于每个聚类集合的聚类描述信息,确定多媒体资源的至少一个目标特征描述信息,每个目标特征描述信息用于表示一个聚类描述信息与其余聚类描述信息之间的关联;基于多媒体资源的至少一个目标特征描述信息,对多媒体资源进行分类,得到多媒体资源的分类结果。采用本发明,可以提高多媒体资源分类的准确性。
-
公开(公告)号:CN110163222B
公开(公告)日:2023-01-24
申请号:CN201811169065.3
申请日:2018-10-08
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V10/46 , G06V10/774
摘要: 本发明实施例公开了一种图像识别的方法,包括:获取待识别的目标素描图像,其中,目标素描图像为线条化图像;通过素描图像识别模型获取目标素描图像的目标特征信息,其中,素描图像识别模型为根据自然图像集合以及素描图像集合训练得到的,自然图像集合包括至少一个自然图像,素描图像集合包括至少一个素描图像,自然图像为非线条化图像,素描图像为线条化图像;根据目标特征信息确定目标素描图像所对应的图像识别结果。本发明实施例还提供了一种模型训练的方法以及服务器。本实施例利用自然图像和素描图像共同训练得到用于识别素描图像的素描图像识别模型,能够有效地提升素描图像的识别能力,从而有利于增加素描图像识别的准确率。
-
公开(公告)号:CN110570375B
公开(公告)日:2022-12-09
申请号:CN201910842646.7
申请日:2019-09-06
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06T5/00
摘要: 本申请实施例公开了一种图像处理方法、装置、电子设置以及存储介质,本申请属于人工智能领域,方法包括:获取原始模糊图像,获取去模糊生成模型;模糊生成模型包括顶部卷积层、第一卷积层和第二卷积层;基于顶部卷积层中的卷积函数,对原始模糊图像进行卷积,得到输入模糊图像编码特征;基于第一卷积层中的卷积函数和激活函数,对输入模糊图像编码特征进行卷积,得到第一模糊图像编码特征;将输入模糊图像编码特征和第一模糊图像编码特征叠加为第二模糊图像编码特征;基于第二卷积层中的卷积函数和激活函数,对第二模糊图像编码特征进行卷积,得到与原始模糊图像对应的目标清晰图像。采用本申请,可以提高将模糊图像去模糊的效率。
-
公开(公告)号:CN110555896B
公开(公告)日:2022-12-09
申请号:CN201910837251.8
申请日:2019-09-05
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06T11/60
摘要: 本申请实施例公开了一种图像生成方法、装置以及相关设备,本申请属于人工智能领域,方法包括:获取原始图像中的目标对象的关键数据;基于关键部位调整信息调整所述关键数据,根据调整后的关键数据生成调整对象特征;获取图像风格信息,生成所述图像风格信息对应的风格特征;融合所述调整对象特征和所述风格特征,得到目标特征,在图像生成模型中,基于所述目标特征输出与所述关键部位调整信息和所述图像风格信息相关联的目标图像。采用本申请,可以提高图像处理的效率。
-
-
-
-
-
-
-
-
-