专利检索 ap:("腾讯科技(深圳)有限公司" OR "安徽大学") AND inv:"伍洋" 第 1 页

1.

发明公开
三维模型的重建方法、装置、设备及存储介质审中-公开

公开(公告)号：CN117218278A

公开(公告)日：2023-12-12

申请号：CN202310315796.9

申请日：2023-03-16

申请人： 腾讯科技(深圳)有限公司 , 安徽大学

发明人： 付燕平 , 刘勇鑫 , 赵海峰 , 曹炎培 , 伍洋 , 单瀛 , 郄小虎 , 王巨宏

IPC分类号： G06T17/00 , G06T15/00 , G06T7/90 , G06N3/045 , G06N3/08

摘要： 本申请实施例公开了一种三维模型的重建方法、装置、设备及存储介质，属于三维重建技术领域。该方法包括：获取彩色图像序列，所述彩色图像序列中包含至少两张彩色图像，所述至少两张彩色图像为不同视角下对目标场景进行拍摄得到；基于所述彩色图像序列，确定所述目标场景对应的符号距离场，以及所述目标场景中各个空间点对应的几何特征；基于所述符号距离场以及所述几何特征，确定各个视角下所述彩色图像对应的渲染图像；基于所述彩色图像与所述渲染图像之间的颜色差异，对所述符号距离场进行细节优化，得到优化后的符号距离场；基于所述优化后的符号距离场进行三维重建，得到所述目标场景对应的三维模型；提高了三维模型重建的准确性。

2.

发明公开
图像处理方法、装置、电子设备及存储介质审中-公开

公开(公告)号：CN117218006A

公开(公告)日：2023-12-12

申请号：CN202211445729.0

申请日：2022-11-18

申请人： 腾讯科技(深圳)有限公司 , 安徽大学

发明人： 付燕平 , 单瀛 , 盖振宇 , 伍洋 , 王巨宏

IPC分类号： G06T5/00 , G06T5/50 , G06V10/40 , G06V10/80

摘要： 本申请涉及图像处理方法、装置、电子设备及存储介质。上述方法包括基于特征关联信息对第一图像进行去阴影处理，得到第二图像，特征关联信息用于指示第一类特征与第二类特征之间的关联关系，第一类特征是第一图像的特征，第二类特征是第一图像对应的深度图像的特征；基于第一掩膜图像的注意力权重，对第二图像进行阴影边界修正，得到目标图像，第一掩膜图像用于指示第一图像或者第二图像的阴影边界。本申请提高了所获得的目标图像的去阴影效果，减少了目标图像中出现伪影的情况。本申请实施例可应用于云技术、人工智能、智慧交通、智慧娱乐等各种场景。

3.

发明授权
虚拟对象动作生成方法、装置、计算机设备和存储介质有权

公开(公告)号：CN116681810B

公开(公告)日：2023-10-03

申请号：CN202310970212.1

申请日：2023-08-03

申请人： 腾讯科技(深圳)有限公司

发明人： 伍洋 , 金鹏 , 樊艳波 , 孙钟前 , 杨巍

IPC分类号： G06T13/40 , G06F40/205 , G06F40/30 , G06N3/04 , G06F18/10

摘要： 本申请涉及一种虚拟对象动作生成方法、装置、计算机设备和存储介质。所述方法包括：获取动作描述文本；对动作描述文本进行语义层次化解析，得到多个语义层级的动作描述信息，并获取用于生成虚拟对象动作的采样噪声信号；对多个语义层级的动作描述信息进行编码，得到多个语义层级各自的动作描述表征；基于多个语义层级各自的动作描述表征，对采样噪声信号进行多个语义层级的降噪处理，得到级联降噪后的动作特征向量；其中，每个语义层级的降噪处理输出的动作特征向量的粒度级逐语义层级递减；对级联降噪后的动作特征向量进行解码，得到虚拟对象动作。采用本方法能够提高所生成的虚拟对象动作的准确度。

4.

发明公开
基于动作生成模型的动作生成方法、装置及设备审中-公开

公开(公告)号：CN116702707A

公开(公告)日：2023-09-05

申请号：CN202310969504.3

申请日：2023-08-03

申请人： 腾讯科技(深圳)有限公司

发明人： 伍洋 , 谢震宇 , 孙钟前 , 杨巍 , 梁小丹

IPC分类号： G06F40/126 , G06F40/30 , G06F18/214 , G06F18/22 , G06N20/00

摘要： 本申请公开了一种基于动作生成模型的动作生成方法、装置及设备，涉及人工智能技术领域。所述方法包括：获取包含动作信息的输入文本；通过文本编码器生成输入文本对应的文本特征；通过基础扩散模型在第一维度的特征空间下，根据文本特征生成与输入文本的语义相匹配的中间动作序列；通过进阶扩散模型在第二维度的特征空间下，对中间动作序列进行细节增强处理，生成与输入文本相匹配的输出动作序列，第二维度大于第一维度。本申请通过基础扩散模型初步生成与输入文本的语义相匹配的中间动作序列，并通过进阶扩散模型对中间动作序列进行细节增强处理，提升了输出动作序列中的细节丰富度。

5.

发明公开
虚拟对象动作生成方法、装置、计算机设备和存储介质审中-公开

公开(公告)号：CN116681810A

公开(公告)日：2023-09-01

申请号：CN202310970212.1

申请日：2023-08-03

申请人： 腾讯科技(深圳)有限公司

发明人： 伍洋 , 金鹏 , 樊艳波 , 孙钟前 , 杨巍

IPC分类号： G06T13/40 , G06F40/205 , G06F40/30 , G06N3/04 , G06F18/10

摘要： 本申请涉及一种虚拟对象动作生成方法、装置、计算机设备和存储介质。所述方法包括：获取动作描述文本；对动作描述文本进行语义层次化解析，得到多个语义层级的动作描述信息，并获取用于生成虚拟对象动作的采样噪声信号；对多个语义层级的动作描述信息进行编码，得到多个语义层级各自的动作描述表征；基于多个语义层级各自的动作描述表征，对采样噪声信号进行多个语义层级的降噪处理，得到级联降噪后的动作特征向量；其中，每个语义层级的降噪处理输出的动作特征向量的粒度级逐语义层级递减；对级联降噪后的动作特征向量进行解码，得到虚拟对象动作。采用本方法能够提高所生成的虚拟对象动作的准确度。

6.

发明公开
视频生成方法、装置、存储介质及计算机设备审中-实审

公开(公告)号：CN117036583A

公开(公告)日：2023-11-10

申请号：CN202211255944.4

申请日：2022-10-13

申请人： 腾讯科技(深圳)有限公司

发明人： 伍洋 , 胡鹏飞 , 齐晓娟 , 吴秀哲 , 单瀛 , 徐静

IPC分类号： G06T17/00 , G06T7/90 , G06T7/70 , G06T13/40 , G06V10/26 , G06V10/82 , G06N3/047 , G06N3/048 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/08

摘要： 本申请公开了一种视频处理方法，包括：提取目标用户的训练视频对应的条件输入；基于条件输入、三维坐标和视角方向对预设的单个神经辐射场进行网络训练，得到视频生成模型；视频生成模型为基于图像重建损失和嘴部强调损失训练得到；根据视频生成模型对目标用户的待重构视频进行对象重构，得到目标用户对应的重构视频。本申请应用人工智能技术通过在条件输入中引入头部姿态信息和头部位置信息，使得后续视频重构能够引入肩部运动状态的考量，从而让头部和肩部之间的运动更加协调稳定，且训练过程中通过图像重建损失和嘴部强调损失，使得重构视频中人物的嘴部形状随音频变化更逼真，进而有效提升了重构视频中对象显示效果的真实性。

7.

发明公开
三维纹理图像的生成方法、装置、计算机设备和存储介质审中-公开

公开(公告)号：CN116977531A

公开(公告)日：2023-10-31

申请号：CN202310945819.4

申请日：2023-07-28

申请人： 腾讯科技(深圳)有限公司

发明人： 樊艳波 , 李柯涵 , 伍洋 , 孙钟前 , 杨巍

IPC分类号： G06T15/04 , G06T15/20 , G06T3/40

摘要： 本申请涉及一种三维纹理图像的生成方法、装置、计算机设备、存储介质和计算机程序产品。所述方法可应用于人工智能领域，该方法包括：获取三维物体模型和纹理描述文本；在不同视角下对三维物体模型进行渲染，得到各视角下的第一模型渲染图像和用于表示三维物体模型在各视角下的第一深度图像；针对各视角下的第一模型渲染图像，通过纹理场对第一模型渲染图像进行纹理处理，得到二维的参考纹理；将参考纹理作为噪声数据添加至去噪过程图像，得到加噪图像；根据加噪图像、纹理描述文本和第一深度图像进行图像生成，获得各视角下的纹理图像；拼接各视角下的纹理图像，得到三维纹理图像。采用本方法能够有效提高三维纹理图像的纹理一致性和图像质量。

8.

发明授权
基于动作生成模型的动作生成方法、装置及设备有权

公开(公告)号：CN116702707B

公开(公告)日：2023-10-03

申请号：CN202310969504.3

申请日：2023-08-03

申请人： 腾讯科技(深圳)有限公司

发明人： 伍洋 , 谢震宇 , 孙钟前 , 杨巍 , 梁小丹

IPC分类号： G06F40/126 , G06F40/30 , G06F18/214 , G06F18/22 , G06N20/00

摘要： 本申请公开了一种基于动作生成模型的动作生成方法、装置及设备，涉及人工智能技术领域。所述方法包括：获取包含动作信息的输入文本；通过文本编码器生成输入文本对应的文本特征；通过基础扩散模型在第一维度的特征空间下，根据文本特征生成与输入文本的语义相匹配的中间动作序列；通过进阶扩散模型在第二维度的特征空间下，对中间动作序列进行细节增强处理，生成与输入文本相匹配的输出动作序列，第二维度大于第一维度。本申请通过基础扩散模型初步生成与输入文本的语义相匹配的中间动作序列，并通过进阶扩散模型对中间动作序列进行细节增强处理，提升了输出动作序列中的细节丰富度。

9.

发明公开
一种视频检测方法、系统及存储介质和服务器审中-实审

公开(公告)号：CN114581821A

公开(公告)日：2022-06-03

申请号：CN202210166453.6

申请日：2022-02-23

申请人： 腾讯科技(深圳)有限公司

发明人： 陈长汶 , 刘烨 , 单瀛 , 李思远 , 伍洋 , 郄小虎

IPC分类号： G06V20/40 , G06V10/40 , G06V10/80 , G06V10/74 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08

摘要： 本发明实施例公开了一种视频检测方法、系统及存储介质和服务器，应用于基于人工智能的信息处理技术领域。视频检测系统会将目标视频分为多个模态的目标检测数据，分别获取到对应的单模态注意特征，再将这些单模态注意特征进行融合得到目标视频的全局特征，然后获取到全局特征与特定检测信息之间的相似性特征信息，并基于相似性特征信息确定与特定检测信息相关的视频片段。这样通过对各个模态的目标检测数据的单独处理，可以较精确地获取目标视频中包含的所有类型的信息，进而将各个单模态注意特征融合得到的全局特征能更真实地反映目标视频，最终确定的视频片段也更准确。

10.

发明授权
模型训练方法、图像风格转换方法、装置及电子设备有权

公开(公告)号：CN117611434B

公开(公告)日：2024-05-07

申请号：CN202410068980.2

申请日：2024-01-17

申请人： 腾讯科技(深圳)有限公司

发明人： 周洲 , 樊艳波 , 伍洋 , 孙钟前

IPC分类号： G06T3/04 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N3/0464 , G06N3/048 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82

摘要： 本申请实施例提供了一种模型训练方法、图像风格转换方法、装置、电子设备及计算机可读存储介质，涉及人工智能及图像处理技术领域。该方法包括：确定第一样本集，第一样本集包括多个样本内容图像和多个样本风格图像；根据第一样本集对第一初始模型进行对抗训练，得到训练后的第一初始模型，第一初始模型包括第一生成器，根据训练后的第一初始模型，获得风格转换模型，风格转换模型包括训练后的第一初始模型中的第一生成器。本申请实施例可平衡全局的风格迁移以及保留内容图像的局部细节。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类