-
公开(公告)号:CN113469017B
公开(公告)日:2024-09-17
申请号:CN202110725463.4
申请日:2021-06-29
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06V40/20 , G06V10/82 , G06N3/0464
摘要: 本发明实施例公开了一种图像处理方法、装置及电子设备。所述方法包括:获得包含有目标对象的多帧二维图像;检测所述多帧二维图像中的第一二维图像的手部,得到所述第一二维图像中的所述目标对象的手部的初始检测框;基于所述初始检测框在所述第一二维图像中的区域确定第二二维图像中的第一区域,基于所述第二二维图像中的所述第一区域内的像素点获得所述第二二维图像中所述手部的检测框、所述手部的关键点信息和所述手部对应的状态类别信息中的至少一种信息;所述第二二维图像为所述第一二维图像后的一帧图像。
-
公开(公告)号:CN113688737B
公开(公告)日:2024-08-13
申请号:CN202110982660.4
申请日:2017-12-15
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06V40/16 , G06V10/46 , G06V10/774 , G06V10/82 , G06N3/08
摘要: 本申请实施方式公开了一种人脸图像处理方法、用于训练神经网络的方法、装置、电子设备、计算机可读存储介质以及计算机程序,其中的方法主要包括:将待处理人脸图像输入至神经网络中;经由所述神经网络提取所述待处理人脸图像的包括至少一个三维不动关键点在内的人脸关键点信息。
-
公开(公告)号:CN113496143B
公开(公告)日:2024-07-16
申请号:CN202010196461.6
申请日:2020-03-19
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06V40/20 , G06V10/764 , G06V40/16 , G06V20/40
摘要: 本公开提供了一种动作识别方法及装置、存储介质,其中,包括:获取场景图像;对所述场景图像进行对象的不同部位检测、同一对象中不同部位的关联以及对象的动作识别,确定所述场景图像包括的至少一个对象和所述至少一个对象中每个对象的目标动作类型。
-
公开(公告)号:CN111340084B
公开(公告)日:2024-05-17
申请号:CN202010106959.9
申请日:2020-02-20
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06V10/762 , G06V10/44 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/08
摘要: 本申请公开了一种数据处理方法及装置、处理器、电子设备、存储介质。该方法包括:获取待聚类簇对和聚类网络,其中,所述聚类网络以簇对的纯度为监督信息训练得到,所述所述簇对的纯度用于表征簇对中的参考类别的纯度,所述参考类别为所述簇对中包含数据的数量最多的类别;使用所述聚类网络对所述待聚类簇对进行处理,得到第一合并分数,其中,所述第一合并分数用于表征所述待聚类簇对的纯度;基于所述第一合并分数,得到所述待聚类簇对的聚类结果。
-
公开(公告)号:CN113610967B
公开(公告)日:2024-03-26
申请号:CN202110929512.6
申请日:2021-08-13
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06T17/00 , G06T7/73 , G06N3/0464 , G06N3/08
摘要: 本公开提供了一种三维点检测的方法、装置、电子设备及存储介质,其中,该方法包括:获取多个视角下对多个目标对象进行拍摄得到的目标图像,以及基于获取的目标图像确定的多个目标对象中每个目标对象的候选三维点的三维坐标信息;针对每个目标对象,执行如下步骤:基于目标对象的候选三维点的三维坐标信息,确定目标对象对应的候选三维空间;基于目标对象对应的候选三维空间、以及目标图像,确定目标对象的目标三维点的三维坐标信息。本公开可以准确的对多个目标对象的点进行检测,还可以显著提升检测的效率。
-
公开(公告)号:CN111179332B
公开(公告)日:2023-12-19
申请号:CN201811333196.0
申请日:2018-11-09
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06T7/593
摘要: 本发明实施例公开了一种图像处理方法及装置、电子设备及存储介质。所述方法包括:获得3D图像,其中,所述3D图像包括:2D图像和与所述2D图像对应的深度图像;根据所述2D图像确定目标的2D特征;根据所述深度图像,获得所述目标的深度值;结合所述2D特征及所述深度值,确定所述目标所对应采集对象的几何特征。
-
公开(公告)号:CN113326922B
公开(公告)日:2023-06-13
申请号:CN202110602323.8
申请日:2021-05-31
申请人: 北京市商汤科技开发有限公司
IPC分类号: G06N3/045 , G06N3/0475 , G06N3/084
摘要: 本公开提供了一种神经网络的生成方法、装置、电子设备及存储介质。其中,该方法包括:从基于多个结构相同的超大神经网络确定的路径搜索空间中,确定待训练路径;基于所述待训练路径中的各个算子分别在多个所述超大神经网络中的第一算子内参、以及所述待训练路径分别在多个所述超大神经网络中的路径权重,确定所述待训练路径中各算子在所述待训练路径中的第二算子内参;利用所述第二算子内参,对多个所述超大神经网络进行本轮训练;基于多轮训练后的多个所述超大神经网络,生成目标神经网络。
-
公开(公告)号:CN113299312B
公开(公告)日:2023-04-28
申请号:CN202110560359.4
申请日:2021-05-21
申请人: 北京市商汤科技开发有限公司
摘要: 本申请提出一种图像生成方法、装置、设备以及存储介质。其中,所述方法可以包括:接收音频数据,提取所述音频数据包括的音频序列对应的文本特征。所述文本特征表征对应音频序列的文本内容。基于所述音频序列对应的文本特征,进行面部特征映射,得到与所述音频序列对应的面部特征。所述面部特征表征所述音频序列对应的发音动作。根据所述音频序列对应的面部特征以及接收的人脸图像,生成与所述音频序列对应的发音人脸图像。
-
公开(公告)号:CN110909581B
公开(公告)日:2023-04-14
申请号:CN201811090041.9
申请日:2018-09-18
申请人: 北京市商汤科技开发有限公司
摘要: 本发明实施例提供了一种数据处理方法及装置、电子设备及存储介质。所述数据处理方法包括:根据目标的3D图像,获得目标支架的3D特征,其中,所述3D图像包括:2D图像和深度图像;根据所述3D特征,确定所述目标支架的3D姿态;将所述3D姿态投影到2D成像平面内,获得第一2D坐标;基于所述第一2D坐标及基于所述2D图像确定的第二2D坐标之间的差异,进行所述3D姿态的优化。
-
公开(公告)号:CN112884637B
公开(公告)日:2023-04-07
申请号:CN202110130196.6
申请日:2021-01-29
申请人: 北京市商汤科技开发有限公司
摘要: 本公开提供一种特效生成方法、装置、设备及存储介质,其中方法包括:将目标人脸图中的头发区域进行模糊处理,得到模糊头发图;根据所述目标人脸图,生成纹理图、人脸掩膜图和头发掩膜图;将所述人脸掩膜图和头发掩膜图进行融合,得到融合掩膜图;基于根据所述融合掩膜图确定的融合比例,将所述模糊头发图和所述纹理图进行融合,得到所述目标人脸图的特效图。
-
-
-
-
-
-
-
-
-