-
公开(公告)号:CN110148212B
公开(公告)日:2023-01-31
申请号:CN201910412248.1
申请日:2019-05-17
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06T17/00 , G06N3/08 , G06N3/0464
摘要: 本公开涉及一种动作序列生成方法及装置、电子设备和存储介质,其中,所述方法包括:获取通过多个随机过程生成的第一噪声向量序列;利用卷积神经网络处理所述第一噪声向量序列,生成目标人体骨骼动作序列。本公开实施例可生成多个时间步的人体骨骼动作序列。
-
公开(公告)号:CN110443363B
公开(公告)日:2022-06-07
申请号:CN201810418432.2
申请日:2018-05-04
申请人: 北京市商汤科技开发有限公司
摘要: 本公开涉及图像特征学习方法及装置。该方法包括:通过神经网络获取各个训练图像的特征向量;根据各个训练图像的特征向量与各个记忆单元记录的特征向量的匹配度,确定目标函数值;根据各个训练图像的特征向量更新相应的记忆单元记录的特征向量;若目标函数值不满足训练目标,则根据目标函数值与训练目标的差距,优化该神经网络的参数。本公开无需进行数据标注,无需假设输入数据服从某种概率分布,因此灵活性较高,且计算过程较简单,实现起来较方便,学习效果能够得到保证。
-
公开(公告)号:CN110210560B
公开(公告)日:2021-11-30
申请号:CN201910472078.6
申请日:2019-05-31
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06K9/62
摘要: 本申请实施例提供了一种分类网络的增量训练方法、分类方法及装置、设备及存储介质。所述方法,包括:利用第一分类网络对多个类别的多个训练图像样本进行特征提取,得到所述多个训练图像样本的第一样本特征,其中,所述多个训练图像样本包括:第一数量的老类别图像样本及第二数量的新类别图像样本,所述第二数量大于所述第一数量;对所述多个训练图像样本的第一样本特征进行归一化处理,得到多个训练图像样本的第一归一化特征;基于所述多个训练图像样本的第一归一化特征,确定网络损失;基于所述网络损失,调整所述第一分类网络的网络参数。
-
公开(公告)号:CN110634167B
公开(公告)日:2021-07-20
申请号:CN201910927729.6
申请日:2019-09-27
申请人: 北京市商汤科技开发有限公司
摘要: 本公开涉及一种神经网络训练方法及装置和图像生成方法及装置,所述方法包括:将第一随机向量输入生成网络,获得第一生成图像;将第一生成图像和第一真实图像输入判别网络,获得第一判别分布与第二判别分布;根据第一判别分布、第二判别分布、第一目标分布、第二目标分布,确定判别网络的第一网络损失;根据第一判别分布和第二判别分布,确定生成网络的第二网络损失;根据第一网络损失和第二网络损失,对抗训练生成网络和判别网络。根据本公开的实施例的神经网络训练方法,判别网络可针对输入图像输出判别分布,以概率分布的形式描述输入图像的真实性,可从多个方面考量输入图像的真实性,减少信息丢失,提高训练精度。
-
公开(公告)号:CN109801270B
公开(公告)日:2021-07-16
申请号:CN201811639702.9
申请日:2018-12-29
申请人: 北京市商汤科技开发有限公司
摘要: 本公开涉及一种锚点确定方法及装置、电子设备和存储介质,所述方法包括:对待处理图像进行特征提取,得到所述待处理图像的第一特征图;通过锚点预测网络对所述第一特征图进行锚点预测,得到所述第一特征图中生成锚点的位置信息和所述锚点的形状信息。本公开实施例能够生成非均匀且形状任意的锚点,提高物体检测的准确率。
-
公开(公告)号:CN109767446B
公开(公告)日:2021-04-30
申请号:CN201811624119.0
申请日:2018-12-28
申请人: 北京市商汤科技开发有限公司
摘要: 本公开实施例公开了一种实例分割方法,该方法包括:获取图像的一个以上建议区域,以及每个建议区域的特征,将每个建议区域的特征输入至包含N个层级的预测网络中,进行N级物体框预测和物体框中的掩膜预测,输出得到图像的实例分割的结果。通过实施上述方案,提高了实例分割的准确率。
-
公开(公告)号:CN108229491B
公开(公告)日:2021-04-13
申请号:CN201710113099.X
申请日:2017-02-28
申请人: 北京市商汤科技开发有限公司
摘要: 公开了从图片中检测物体关系的方法、装置和设备。根据一个实施方式,从图片中检测物体关系的方法包括:检测所述图片中的多个物体,获得每个物体的图片区域特征;对图片中检测到的物体进行配对,以获得候选主宾对,每个候选主宾对包括成对的主语物体的图片区域特征和宾语物体的图片区域特征;至少基于候选主宾对中的主语物体的图片区域特征和宾语物体的图片区域特征,获得关系谓语的图片特征;根据特征信息并依次经N个子神经网络检测所述多个物体的位置关系,并将所述第N个子神经网络的检测结果作为所述图片中物体关系的最终检测结果。
-
公开(公告)号:CN108228700B
公开(公告)日:2021-01-26
申请号:CN201710919275.9
申请日:2017-09-30
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06F16/58
摘要: 本申请实施方式公开了图像描述模型的训练方法、装置、电子设备及存储介质,其中的方法包括:获取图像样本及其图像描述;至少将所述图像样本及其图像描述分别输入到待训练的图像描述模型和已经训练完成的参考图像描述模型,以至少获得所述图像描述模型输出的表示所述图像描述对应所述图像样本的第一概率和所述参考图像描述模型输出的表示所述图像描述对应所述图像样本的第二概率;至少以所述第二概率为指导信息调整所述图像描述模型的模型参数,以至少使所述图像描述模型输出的第一概率等于或大于所述参考图像描述模型输出的第二概率。
-
公开(公告)号:CN109089133B
公开(公告)日:2020-08-11
申请号:CN201810892997.4
申请日:2018-08-07
申请人: 北京市商汤科技开发有限公司
IPC分类号: H04N21/232 , H04N21/432 , H04N21/234 , H04N21/44
摘要: 本公开涉及一种视频处理方法及装置、电子设备和存储介质,所述方法包括:根据查询文本段落的段落信息和视频库中多个视频的视频信息,确定多个视频中与查询文本段落相关联的预选视频;根据预选视频的视频帧信息和查询文本段落的语句信息,确定预选视频中的目标视频。根据本公开的实施例的视频处理方法,可通过视频与查询文本段落的相关性来检索视频,可精确查找目标视频,避免查询结果冗余,并可处理自然语言形式的查询文本段落,不会受到内容标签的固有内容的限制。
-
公开(公告)号:CN111340030A
公开(公告)日:2020-06-26
申请号:CN202010093403.0
申请日:2020-02-14
申请人: 北京市商汤科技开发有限公司
摘要: 本公开提供了一种图像处理方法及装置、电子设备、计算机可读存储介质,其中,基于目标图像中相邻的对象之间的遮挡关系筛选与被遮挡的目标对象有遮挡关系的目标遮挡对象,之后基于筛选得到的目标遮挡对象的模态掩模、被遮挡的目标对象的模态掩模来确定被遮挡的目标对象被遮挡部分的轮廓信息以及被遮挡部分的轮廓内每个像素点的图像信息,能够恢复目标对象中被遮挡的部分。
-
-
-
-
-
-
-
-
-