-
公开(公告)号:CN110210344B
公开(公告)日:2024-08-06
申请号:CN201910419763.2
申请日:2019-05-20
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请的实施例揭示了一种视频动作识别方法及装置,该方法包括:获取视频流中视频图像序列在空间和设定通道上抽取的原始特征,所述原始特征是所述视频图像序列在时间、空间和通道维度上的特征联合表示;对所述原始特征进行所述通道维度和时间维度的分离处理,获得所述视频图像序列的分离特征;汇合所述分离特征与所述原始特征,获得所述视频图像序列的目标特征;根据所述目标特征识别所述视频图像序列中包含的动作,获得动作识别结果。采用该方法能够对视频流中包含的动作进行准确识别。
-
公开(公告)号:CN117474786A
公开(公告)日:2024-01-30
申请号:CN202210826215.3
申请日:2022-07-14
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明公开了一种视频降噪方法、视频播放方法、装置及电子设备;方法包括以下步骤:获取待处理视频;确定待处理视频中待处理图像与上一帧的参考图像之间的帧差;根据帧差确定待处理图像的滤波系数;根据帧差、参考图像中各个像素点的像素值和待处理图像的滤波系数,对待处理图像的像素点进行滤波处理,得到第一图像;对第一图像中包含目标对象的区域图像进行降噪处理;根据降噪处理后的区域图像和第一图像,得到完成视频降噪的目标图像;本发明能够提高降噪效率,通过本发明对待处理图像的滤波处理,使得整体图像也满足一定的降噪要求,通过对视频中需要重点关注的区域图像的单独降噪,提高了视频的降噪效果,可以广泛应用于互联网技术领域。
-
公开(公告)号:CN117423120A
公开(公告)日:2024-01-19
申请号:CN202210790584.1
申请日:2022-07-06
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V30/244 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/08
摘要: 本发明公开了一种字库生成方法和装置、存储介质及电子设备。其中,该方法包括:获取第一样本字库对应的第一源图片集合和第二样本字库对应的第一目标图片集合;使用第一源图片集合和第一目标图片集合对待训练的初始字体转换模型进行训练,直到初始字体转换模型对应的目标损失值满足预设的损失条件,结束训练,将结束训练时的第一初始生成器确定为第一目标生成器,其中,第一目标生成器用于将包含源字体的字的图片转换成包含目标字体的字的图片,第一预测目标图片与第一样本目标图片中包含的字不同;目标损失值是根据第一初始鉴别器对应的第一生成对抗损失值确定得到的损失值。本发明解决了在字库生成过程中出现的复杂性较高的技术问题。
-
公开(公告)号:CN117216234A
公开(公告)日:2023-12-12
申请号:CN202311050423.X
申请日:2023-08-18
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F16/335 , G06F16/33 , G06N3/0499 , G06N3/08
摘要: 一种基于人工智能的话术改写方法、装置、设备及存储介质,涉及人工智能技术领域。该方法包括:获取指定领域的语料数据;采用语料数据对第一语言模型进行预训练,得到预训练后的第一语言模型;基于语料数据,生成适用于指定领域的话术改写任务的至少一条指令数据,指令数据用于对指定领域的输入文本进行话术风格改写,生成输入文本对应的输出文本;采用指令数据对预训练后的第一语言模型进行调整,得到调整后的第一语言模型,调整后的第一语言模型用于执行指定领域的话术改写任务。实现了自动化的话术改写,降低了人力和时间成本,并且使用指令增强的方法来提高模型在话术改写任务上的效果,使得最终训练得到的模型能够在达到高质量的改写效果。
-
公开(公告)号:CN117205568A
公开(公告)日:2023-12-12
申请号:CN202311010314.5
申请日:2023-08-10
申请人: 腾讯科技(深圳)有限公司
IPC分类号: A63F13/60 , G06F40/126 , G06N3/0499 , G06F40/10 , G06F18/214
摘要: 本申请公开了一种文本生成模型的训练方法、文本生成方法、装置及设备,属于计算机技术领域。方法包括:获取样本游戏对象进行样本游戏对局的样本对局数据;通过第一网络模型基于样本对局数据确定多个第一参考文本;通过质量指标确定模型基于样本对局数据和各个第一参考文本,确定各个第一参考文本的参考质量指标;基于各个第一参考文本的参考质量指标,对第一网络模型进行训练,得到文本生成模型,文本生成模型用于基于目标游戏对象进行目标游戏对局的目标对局数据确定目标参考文本。本申请实现了使第一网络模型朝着能生成高质量文本的方向进行优化,提高文本生成模型的准确性,从而使文本生成模型能生成高质量的文本。
-
公开(公告)号:CN116977543A
公开(公告)日:2023-10-31
申请号:CN202310145358.2
申请日:2023-02-06
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请实施例公开了一种三维重建方法、装置、设备、存储介质及程序产品;在本申请实施例中,获取待构建对象的目标二维图像,以及获取对所述待构建对象所在的三维空间进行采样得到的采样点;根据所述目标二维图像,确定所述采样点与所述待构建对象之间的目标距离以及所述目标距离对应的目标梯度;对所述目标距离和所述目标梯度进行融合处理,得到所述采样点的距离向量;根据所述采样点的距离向量对所述采样点的坐标进行调整,得到所述待构建对象的表面点的三维坐标;根据所述待构建对象的表面点的三维坐标,对所述待构建对象进行三维重建。本申请实施例可以提高三维重建的效率。
-
公开(公告)号:CN116977231A
公开(公告)日:2023-10-31
申请号:CN202310474602.X
申请日:2023-04-26
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明实施例公开了一种图像处理方法、装置、计算机设备及存储介质,其中方法包括:获取待处理的第一图像以及与所述第一图像相关联的第二图像;所述相关联是指:所述第一图像与所述第二图像包含相同的物理对象;从所述第二图像中获取所述物理对象的姿态信息及姿态变化范围;基于所述第二图像中的所述姿态信息及所述姿态变化范围,从所述第一图像中确定出所述物理对象的检测区域;在所述第一图像中的检测区域内对所述物理对象进行姿态检测处理,得到所述物理对象在所述第一图像中的姿态检测结果,可提升姿态检测的准确性。
-
公开(公告)号:CN110163048B
公开(公告)日:2023-06-02
申请号:CN201810752953.1
申请日:2018-07-10
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V40/20 , G06F3/01 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/0475 , G06N3/094 , G06N3/084
摘要: 本申请公开了一种手部关键点的识别模型训练方法、识别方法及设备,属于手势识别领域。所述方法包括:通过Cycle‑GAN模型,将样本虚拟图像转化为仿真图像,样本虚拟图像是三维建模生成的图像,且样本虚拟图像包含手部关键点对应的关键点坐标,仿真图像用于模仿真实场景下采集的图像;提取仿真图像中的手部图像;根据仿真图像中的手部图像以及关键点坐标,训练手部关键点识别模型,手部关键点识别模型用于根据输入的真实图像输出所述真实图像中手部的手部关键点坐标。本申请实施例中,训练样本更加趋近于采集的真实图像,后续利用该手部关键点识别模型对真实图像进行手势识别的准确率更高。
-
公开(公告)号:CN110147702B
公开(公告)日:2023-05-23
申请号:CN201810771226.X
申请日:2018-07-13
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明提出了一种用于实时视频的目标检测与识别的方法和系统。方法包括:获取当前视频帧图像中目标物体的位置范围CX,其中,获取所述位置范围CX包括:判断当前视频帧的前一帧图像的目标物体识别结果RX‑1和两帧之前的图像的目标物体识别结果RX‑2是否相同;不相同时,通过第一级神经网络对当前视频帧的图像进行目标物体位置检测,获取当前帧图像中的目标物体位置范围CX;相同时,根据上一帧图像中的目标物体位置范围CX‑1确定当前帧图像中的目标物体位置范围CX;以及通过第二级神经网络,根据位置范围CX,对当前帧图像进行目标物体识别。从而,能够降低用于位置检测的第一级神经网络的运行频率,加快识别速度并降低CPU和内存资源的占用。
-
公开(公告)号:CN111091188B
公开(公告)日:2022-03-25
申请号:CN201911294777.2
申请日:2019-12-16
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请提供了一种神经网络的前向计算方法、装置及计算机可读存储介质,神经网络中的至少一个数据处理层进行数据处理的方法包括:获取数据处理层的输入数据和权重数据;将输入数据采用第一纹理存储结构进行存储,得到第一纹理数据,将权重数据采用第二纹理存储结构进行存储,得到第二纹理数据;基于第一纹理数据和第二纹理数据进行数据处理层的数据处理,得到数据处理层的输出数据。对于神经网络的至少一个数据处理层,将输入数据和权重数据分别存储在对应的纹理存储结构中,由于纹理存储结构索引简单方便,且数据存储量大,节省了数据处理层在进行数据处理过程中读取和存储数据的时间,使得神经网络的前向计算效率大大提高。
-
-
-
-
-
-
-
-
-