-
公开(公告)号:CN109190760B
公开(公告)日:2021-11-30
申请号:CN201810885459.2
申请日:2018-08-06
申请人: 北京市商汤科技开发有限公司
摘要: 本公开涉及一种神经网络训练方法及装置和环境处理方法及装置,所述方法包括:将当前训练周期的环境状态向量输入神经网络,获得动作输出和衡量输出;根据环境状态向量和动作输出确定第一奖惩反馈;根据第一奖惩反馈、历史训练周期的第一奖惩反馈和衡量输出,确定神经网络的模型损失;根据模型损失,调整神经网络的网络参数值;在神经网络满足训练条件时,获得训练后的神经网络。根据本公开的实施例的神经网络训练方法,通过当前训练周期和历史训练周期的多个奖惩反馈来确定的模型损失,在训练神经网络的过程中不易陷入局部最优解,可获得拟合优度较高的神经网络。
-
-
公开(公告)号:CN108229355B
公开(公告)日:2021-03-23
申请号:CN201711407861.1
申请日:2017-12-22
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06K9/00
摘要: 本公开实施例公开了一种行为识别方法和装置、电子设备、计算机存储介质、程序,其中方法包括:对至少一帧视频图像执行人体关键点检测,获得所述至少一帧视频图像的多个人体关键点;基于所述至少一帧视频图像的多个人体关键点的特征信息以及所述多个人体关键点的关联信息,得到所述至少一帧视频图像的行为识别结果。本公开实施例通过结合人体关键点的特征信息和人体关键点之间的关联信息,使局部信息和整体信息都得到充分的利用,提高了行为识别的准确度。
-
公开(公告)号:CN108229280B
公开(公告)日:2020-11-13
申请号:CN201710263004.2
申请日:2017-04-20
申请人: 北京市商汤科技开发有限公司
摘要: 本发明实施例公开了一种时域动作检测方法和系统、电子设备、计算机存储介质,其中,方法包括:获取视频中存在动作实例的时域区间以及所述时域区间的至少一相邻片段;分别提取候选片段中各视频片段的动作特征,其中,所述候选片段包括所述时域区间对应的视频片段及其相邻片段;对所述候选片段中各视频片段的动作特征进行池化处理,获得所述时域区间对应的视频片段的全局特征;基于所述全局特征确定所述时域区间对应的视频片段的动作完整度得分。本发明实施例有益于准确的确定时域区间是否包含完整的动作实例,提高了动作完整度识别的准确率。
-
公开(公告)号:CN109325141B
公开(公告)日:2020-11-10
申请号:CN201810836743.0
申请日:2018-07-26
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06F16/58 , G06F16/53 , G06F16/583
摘要: 本公开涉及一种图像检索方法及装置、电子设备和存储介质。所述方法应用于待检索图像序列集合中,所述方法包括:根据检索对象的检索图像确定待检索图像序列集合中各待检索图像的置信度;根据关联图像的置信度、目标图像与关联图像的特征相似度确定目标图像的关联置信度,并根据关联置信度和目标图像的置信度中的最大值,更新目标图像的置信度;在满足收敛条件时停止更新目标图像的置信度,根据停止更新后得到的目标图像的置信度,在待检索图像序列集合中确定与所述检索图像对应的图像检索结果。本公开实施例可以使得关联图像中的最高置信度得以快速传播,提高待检索图像的置信度传播的稳定性,提高检索结果的准确率。
-
公开(公告)号:CN109189989B
公开(公告)日:2020-11-03
申请号:CN201810814079.X
申请日:2018-07-23
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06F16/738 , G06N3/08
摘要: 本申请实施例提供一种视频描述方法及装置、计算机设备和存储介质,其中,将待描述的视频分割为N个片段;获取预设的网络模型输出的第P个文本特征,所述N为大于等于2的整数,P为大于等于1且小于等于N的整数;将所述N个片段和所述第P个文本特征输入所述网络模型,得到第(P+1)个文本特征;输出所述第(P+1)个文本特征;如此,通过根据前一个文本特征生成下一个文本特征,大大减少了描述视频的文本的冗余,使得文本中的语句更加连贯且简洁。
-
公开(公告)号:CN111339964A
公开(公告)日:2020-06-26
申请号:CN202010130108.8
申请日:2020-02-28
申请人: 北京市商汤科技开发有限公司
摘要: 本公开涉及一种图像处理方法及装置、电子设备和存储介质,其中,所述方法包括:获取待识别的目标图像;利用训练完成的人脸识别模型对所述目标图像进行人脸识别,得到所述目标图像的人脸识别结果;其中,所述人脸识别模型是基于扩展后的样本池中的训练样本进行训练得到的,所述扩展后的样本池中的训练样本是根据第一图像的人脸识别结果以及图像描述信息,对第一图像中的至少一个人脸图像进行标注得到的。本公开实施例可以利用准确性较高的人脸识别模型对人脸进行识别。
-
公开(公告)号:CN110443363A
公开(公告)日:2019-11-12
申请号:CN201810418432.2
申请日:2018-05-04
申请人: 北京市商汤科技开发有限公司
摘要: 本公开涉及图像特征学习方法及装置。该方法包括:通过神经网络获取各个训练图像的特征向量;根据各个训练图像的特征向量与各个记忆单元记录的特征向量的匹配度,确定目标函数值;根据各个训练图像的特征向量更新相应的记忆单元记录的特征向量;若目标函数值不满足训练目标,则根据目标函数值与训练目标的差距,优化该神经网络的参数。本公开无需进行数据标注,无需假设输入数据服从某种概率分布,因此灵活性较高,且计算过程较简单,实现起来较方便,学习效果能够得到保证。
-
公开(公告)号:CN106599789B
公开(公告)日:2019-10-11
申请号:CN201611030170.X
申请日:2016-11-15
申请人: 北京市商汤科技开发有限公司
摘要: 本发明实施例公开了一种视频类别识别方法和装置、数据处理装置和电子设备。其中,方法包括:对视频进行分段,获得多个分段视频;分别对多个分段视频中的各分段视频进行采样,获得各分段视频的原始图像及光流图像;利用空域卷积神经网络处理各分段视频的原始图像以获得所述视频的空域分类结果;以及利用时域卷积神经网络处理各分段视频的光流图像以获得所述视频的时域分类结果;对空域分类结果和时域分类结果进行融合处理,获得所述视频的分类结果。本发明实施例可以提高视频类别识别的正确率。
-
-
-
-
-
-
-
-
-