-
公开(公告)号:CN110933334B
公开(公告)日:2021-08-03
申请号:CN201911288617.7
申请日:2019-12-12
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请提供了一种视频降噪方法、装置、终端及存储介质,属于多媒体技术邻域。视频降噪方法包括:对待处理视频中的目标图像的像素点进行解除像素依赖的空域滤波,得到第一图像;根据第一图像和第一降噪图像之间的帧差,并行对目标图像的像素点进行时域滤波,得到第二图像;根据第二图像的像素点对应的增益系数,对第一图像和第二图像进行融合,得到第二降噪图像。通过对目标图像的像素点进行解除像素依赖的空域滤波,使得目标图像中的各像素点之间不再存在依赖关系,并且根据空域滤波得到的第一图像和第一降噪图像之间的帧差,来并行对目标图像的像素点进行时域滤波,使得视频降噪过程由串行处理转换为并行处理,加速了降噪处理过程。
-
公开(公告)号:CN110970048A
公开(公告)日:2020-04-07
申请号:CN201911233290.3
申请日:2019-12-03
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L21/0208 , G10L21/0224 , G10L25/30
摘要: 本申请的实施例提供了一种音频数据的处理方法及装置。该音频数据的处理方法包括:确定音频数据序列中音频数据的最大值,并根据所述最大值,对所述音频数据序列中包含的音频数据进行压缩处理,得到预处理序列,再基于神经网络对所述预处理序列进行降噪处理,得到目标音频数据。本申请实施例的技术方案提高神经网络的运算速度,保证了神经网络对音频信号的降噪效率。
-
公开(公告)号:CN110334802A
公开(公告)日:2019-10-15
申请号:CN201910435113.7
申请日:2019-05-23
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明涉及一种神经网络模型的构建方法、设备及系统,包括:获取预设神经网络模型;在所述预设神经网络模型的隐藏层后增加伪量化层,得到新的神经网络模型;所述伪量化层用于将隐藏层输出的第一数据类型的数据量化为第二数据类型的数据,以及对所述第二数据类型的数据进行取整计算,以及将所述进行取整计算后的第二数据类型的数据反量化为第一数据类型的数据;基于目标任务,对所述新的神经网络模型进行训练得到收敛的神经网络模型,实现了在对神经网络模型的训练结果不会造成太大影响的情况下,减小了神经网络模型文件的占用空间,减少内存带宽,降低计算资源的需要,获取更高性能,实现低功耗运行。
-
公开(公告)号:CN112748899A
公开(公告)日:2021-05-04
申请号:CN202010512058.X
申请日:2020-06-08
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F7/483 , G10L21/0208 , G10L25/30
摘要: 本申请实施例公开了一种基于人工智能的数据处理方法和相关设备,该方法包括:针对需要进行数据处理的输入参数,在将其输入至模型中后,可以获取第一目标层的第一原始激活值,对第一原始激活值进行量化,确定对应的第一量化激活值,该第一量化激活值处于整型值范围内。也就是说,将第一原始激活值量化为整型值。如此,根据经量化的第一量化激活值和该第一目标层的权重进行前向计算。在该第一量化激活值通过第一目标层完成前向计算后,可以根据对第一原始激活值的量化方式,对经过前向计算的结果进行反量化,得到第一目标层的输出结果。在通过模型完成针对输入参数的计算后,确定输入参数对应的数据。该方法提升了数据处理设备的计算能力。
-
公开(公告)号:CN110933334A
公开(公告)日:2020-03-27
申请号:CN201911288617.7
申请日:2019-12-12
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请提供了一种视频降噪方法、装置、终端及存储介质,属于多媒体技术邻域。视频降噪方法包括:对待处理视频中的目标图像的像素点进行解除像素依赖的空域滤波,得到第一图像;根据第一图像和第一降噪图像之间的帧差,并行对目标图像的像素点进行时域滤波,得到第二图像;根据第二图像的像素点对应的增益系数,对第一图像和第二图像进行融合,得到第二降噪图像。通过对目标图像的像素点进行解除像素依赖的空域滤波,使得目标图像中的各像素点之间不再存在依赖关系,并且根据空域滤波得到的第一图像和第一降噪图像之间的帧差,来并行对目标图像的像素点进行时域滤波,使得视频降噪过程由串行处理转换为并行处理,加速了降噪处理过程。
-
公开(公告)号:CN112926020A
公开(公告)日:2021-06-08
申请号:CN201911244336.1
申请日:2019-12-06
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请实施例提供了一种反卷积处理方法、图像处理方法和相应装置。该方法包括:获取反卷积对应的重排权重,重排权重是对反卷积的原始权重进行倒序重排得到的;根据反卷积的反卷积处理参数,将反卷积的原始输入张量进行数据扩充,得到扩充张量;根据重排权重,对扩充张量进行卷积运算,得到反卷积的输出张量。该方法通过对反卷积的原始权重做预处理来得到重排权重,以及对反卷积的原始输入张量做可并行化的预处理来得到扩充张量,进而根据重排权重和扩充张量,将反卷积运算转换为有成熟并行计算优化方案的卷积运算,且得到与反卷积运算结果相同的输出张量,有效降低了计算方案的复杂度,以便于进行加速优化,实现反卷积运算的降耗。
-
公开(公告)号:CN112733795A
公开(公告)日:2021-04-30
申请号:CN202110088340.4
申请日:2021-01-22
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开了一种人脸图像的视线矫正方法、装置、设备及存储介质,涉及人工智能技术领域。所述方法包括:从人脸图像中获取待矫正眼部图像;基于待矫正眼部图像和目标视线方向,生成眼部运动流场;采用眼部运动流场对待矫正眼部图像进行视线矫正处理,生成矫正后眼部图像;基于矫正后眼部图像,生成经视线矫正后的人脸图像。由于本申请技术方案无需固定头部姿态进行视线矫正,因此对于诸如视频会议、视频通话、视频直播等用户头部姿态实时会发生变化的场景,本申请技术方案具有较好的视线矫正能力。
-
公开(公告)号:CN112991142B
公开(公告)日:2023-06-16
申请号:CN202110349762.2
申请日:2021-03-31
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开了一种图像数据的矩阵运算方法、装置、设备及存储介质,涉及计算机技术领域。所述方法包括:基于图像算子的矩阵尺寸M行N列,在所述图像数据中读取矩阵数据;采用所述图像算子对应的单一计算指令对所述矩阵数据中的每列数据分别计算,得到1行中间计算结果;将所述1行中间计算结果复用重排为N行缓存数据;采用所述单一计算指令对所述缓存数据中目标列的矩阵元素进行计算,得到所述矩阵数据在所述单一计算指令下的计算结果;将所述计算结果输出为所述图像算子对所述矩阵数据的图像处理结果。本申请提高了对于图像数据进行矩阵运算的效率。
-
公开(公告)号:CN110970048B
公开(公告)日:2023-01-17
申请号:CN201911233290.3
申请日:2019-12-03
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G10L21/0208 , G10L21/0224 , G10L25/30
摘要: 本申请的实施例提供了一种音频数据的处理方法及装置。该音频数据的处理方法包括:确定音频数据序列中音频数据的最大值,并根据所述最大值,对所述音频数据序列中包含的音频数据进行压缩处理,得到预处理序列,再基于神经网络对所述预处理序列进行降噪处理,得到目标音频数据。本申请实施例的技术方案提高神经网络的运算速度,保证了神经网络对音频信号的降噪效率。
-
公开(公告)号:CN112733795B
公开(公告)日:2022-10-11
申请号:CN202110088340.4
申请日:2021-01-22
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06V40/16 , G06V40/18 , G06V10/774
摘要: 本申请公开了一种人脸图像的视线矫正方法、装置、设备及存储介质,涉及人工智能技术领域。所述方法包括:从人脸图像中获取待矫正眼部图像;基于待矫正眼部图像和目标视线方向,生成眼部运动流场;采用眼部运动流场对待矫正眼部图像进行视线矫正处理,生成矫正后眼部图像;基于矫正后眼部图像,生成经视线矫正后的人脸图像。由于本申请技术方案无需固定头部姿态进行视线矫正,因此对于诸如视频会议、视频通话、视频直播等用户头部姿态实时会发生变化的场景,本申请技术方案具有较好的视线矫正能力。
-
-
-
-
-
-
-
-
-