专利检索 ap:("腾讯科技(深圳)有限公司" OR "北京大学") AND inv:"刘威" 第 3 页

21.

发明公开
一种数据的处理方法、装置以及存储介质审中-实审

公开(公告)号：CN116450808A

公开(公告)日：2023-07-18

申请号：CN202310708207.3

申请日：2023-06-15

申请人： 腾讯科技(深圳)有限公司

发明人： 刘威 , 蒋杰 , 郜思睿 , 李宗蔚 , 杨志鹏 , 郭春超

IPC分类号： G06F16/335 , G06F16/338 , G06F16/35 , G06F16/532

摘要： 本申请公开了一种数据的处理方法、装置以及存储介质。通过获取坏例样本；然后根据坏例样本生成样本三元组；并对推荐模型的主干网络进行参数冻结；然后对推荐模型中配置的投影矩阵进行训练得到目标矩阵；进而获取推荐模型的主干网络根据目标内容输出的特征向量，以基于特征向量和目标矩阵确定输出特征，并执行推荐任务。从而实现推荐模型基于坏例样本进行快速调整的过程，由于对主干网络进行参数冻结，并采用投影矩阵基于坏例样本构架的三元组对推荐模型进行训练微调，无需对主干网络进行调整，减小了数据处理量，提高了模型的训练效率。

22.

发明授权
自编码器学习方法、装置、计算机设备及存储介质有权

公开(公告)号：CN109948796B

公开(公告)日：2023-07-04

申请号：CN201910190701.9

申请日：2019-03-13

申请人： 腾讯科技(深圳)有限公司

发明人： 焦剑波 , 暴林超 , 魏云超 , 石宏辉 , 刘永雄 , 刘威 , 黄煦涛

IPC分类号： G06N3/088 , G06N3/0464 , G06N3/0442

摘要： 本申请是关于一种自编码器学习方法、装置、计算机设备及存储介质。该方法包括：在拉普拉斯域对所述数据进行噪声叠加，获得叠加噪声数据；通过编码器提取叠加噪声数据的数据特征；根据叠加噪声数据的数据特征进行数据重建，获得重建数据；获取重建数据与初始数据之间的差值；当差值满足收敛条件时，输出编码器的网络参数。本方案首先对初始数据进行拉普拉斯域的噪声叠加，然后根据获得的噪声叠加数据进行特征提取和重建，使得自编码器能够更多的提取到初始数据的上层特征，从而提高自编码器能够从数据中学习到的特征的代表性，提高训练出的编码器的准确性。

23.

发明授权
图像描述模型的训练方法、装置及存储介质有权

公开(公告)号：CN110147806B

公开(公告)日：2023-04-07

申请号：CN201811167476.9

申请日：2018-10-08

申请人： 腾讯科技(深圳)有限公司

发明人： 冯洋 , 马林 , 刘威 , 罗杰波

IPC分类号： G06F18/214 , G06N3/0464 , G06N3/0442

摘要： 本申请实施例公开了一种图像描述模型的训练方法，所述图像描述模型包括卷积编码神经网络和递归解码神经网络；所述方法包括：通过所述卷积编码神经网络，获取图像样本的图像特征向量；通过所述递归解码神经网络，对所述图像特征向量进行解码，得到用于描述所述图像样本的语句；确定所述解码得到的语句与所述图像样本之间的匹配度，根据所述匹配度对所述递归解码神经网络进行调整；确定所述解码得到的语句的通顺度，根据所述通顺度对所述递归解码神经网络进行调整。

24.

发明授权
一种数据处理方法、装置、设备及存储介质有权

公开(公告)号：CN113011555B

公开(公告)日：2023-01-31

申请号：CN202110182052.5

申请日：2021-02-09

申请人： 腾讯科技(深圳)有限公司

发明人： 王子愉 , 姜文浩 , 张子瑄 , 唐伟 , 严骏驰 , 刘威

IPC分类号： G06N3/0442 , G06N3/048 , G06N3/049 , G06N3/08 , G06F18/22

摘要： 本申请实施例公开了一种数据处理方法、装置、设备及计算机可读存储介质。其中方法包括：获取第t个时间步的输入数据对应的K个投影向量，以及M个处理单元在第t‑1个时间步的状态信息，根据M个处理单元在第t‑1个时间步的隐藏状态和K个投影向量分别计算各个处理单元的相似度，并根据各个处理单元的相似度从M个处理单元中筛选出N个激活单元，获取目标激活单元的第一拼接数据，并根据第一拼接数据，计算目标激活单元在第t个时间步的隐藏状态。可见，通过相似度对处理单元进行筛选，可以使得各个处理单元处理与自身信息相关程度较高的数据(即使得各个处理单元处理与自身特性相关的数据)，进而提高人工智能模型的处理结果的准确度。

25.

发明授权
对抗测试看图说话系统的方法和装置有权

公开(公告)号：CN110222578B

公开(公告)日：2022-12-27

申请号：CN201910381832.5

申请日：2019-05-08

申请人： 腾讯科技(深圳)有限公司

发明人： 吴保元 , 许焱 , 樊艳波 , 张勇 , 刘威 , 沈复民 , 申恒涛

IPC分类号： G06V20/70 , G06V10/774 , G06V10/82 , G06N3/04

摘要： 本公开提供了一种对抗测试看图说话系统的方法和相关装置。该方法包括：构造概率对数函数；将所述概率对数函数分解成第一函数项和第二函数项；为第二函数项指定对抗噪声，求解第二函数项最小时的非预定观测位置出现的词组合的概率，并将解出的非预定观测位置出现的词组合的概率代入第一函数项，求解第一函数项最大时的对抗噪声，反复进行迭代，直到满足迭代终止条件；将迭代后得到的对抗噪声叠加到所述看图说话系统要识别的图片上，以期望所述看图说话系统识别出的语句的预定观测位置出现指定的词。本公开实施例不但能够使看图说话系统生成的图像描述语句含有指定的词，还能够指定这些词出现的位置，即在指定的位置出现指定的词。

26.

发明授权
地点识别及其模型训练的方法和装置以及电子设备有权

公开(公告)号：CN110209859B

公开(公告)日：2022-12-27

申请号：CN201910390693.2

申请日：2019-05-10

申请人： 腾讯科技(深圳)有限公司

发明人： 白栋栋 , 凌永根 , 刘威

IPC分类号： G06F16/58 , G06F16/587 , G06F16/583 , G06N3/04

摘要： 本发明揭示了一种地点识别及其模型训练的方法和装置、计算机可读存储介质以及电子设备。方法包括：基于CNN模型的第一部分提取样本图像的局部特征；基于CNN模型的第二部分将局部特征聚合成具有第一维数的特征向量；基于CNN模型的第三部分得到特征向量的压缩表示向量，压缩表示向量具有小于第一维数的第二维数；以及以使得多个图像对应的压缩表示向量之间的距离最小化为目标，调整第一至第三部分的模型参数，直至得到满足预设条件的CNN模型。本发明实施例提供的模型训练方法，通过在CNN模型中引入参数可训练的压缩过程，能够真正实现端到端的训练地点识别模型，得到的CNN模型能够直接获得低维度的图像特征，从而提高地点识别的性能。

27.

发明授权
一种人脸三维图像生成方法、装置和可读介质有权

公开(公告)号：CN109377544B

公开(公告)日：2022-12-23

申请号：CN201811459413.0

申请日：2018-11-30

申请人： 腾讯科技(深圳)有限公司

发明人： 陈雅静 , 林祥凯 , 宋奕兵 , 凌永根 , 暴林超 , 刘威

IPC分类号： G06T15/00 , G06V40/16

摘要： 本发明公开了一种人脸三维图像生成方法、装置和可读介质，属于图像处理技术领域，本发明提供的方法及装置中，利用可调整的训练模型从目标人脸二维图像中识别出的脸部特征参数、拍照环境特征和拍照参数信息，根据脸部特征参数和标准人脸模板库中的三维基底模型重构目标人脸三维模型，模拟拍照环境特征和拍照参数信息对目标人脸三维模型进行渲染获得中间人脸二维图像；在确定出目标人脸二维图像和中间人脸二维图像不满足一致性条件时，调整训练模型并利用调整后的训练模型重新返回根据目标人脸二维图像获得中间人脸二维图像的步骤；在确定满足一致性条件时基于最新重构的目标人脸三维模型得到目标人脸三维图像，提高了目标人脸三维图像的逼真度。

28.

发明授权
音频采集设备定位方法及装置、说话人识别方法及系统有权

公开(公告)号：CN110335313B

公开(公告)日：2022-12-09

申请号：CN201910523416.4

申请日：2019-06-17

申请人： 腾讯科技(深圳)有限公司

发明人： 揭泽群 , 葛政 , 刘威

IPC分类号： G06T7/73 , G06V40/16 , G06F16/29 , G06F16/23

摘要： 本发明涉及图像处理技术领域，具体而言，涉及一种音频采集设备定位方法、音频采集设备定位装置及电子设备，一种说话人识别方法及系统。所述方法包括：获取待检测图像；识别所述待检测图像中的音频采集设备，以获取所述音频采集设备的第一坐标数据；根据所述音频采集设备的第一坐标数据与历史坐标数据计算位移数据，以根据所述位移数据计算所述待检测图像中音频采集设备的精确坐标。本发明的技术方案一方面利用图像识别技术确定待检测图像中的唯一的音频采集设备，避免待检测图像中出现多个目标的错误；另一方面，能够结合历史坐标数据对第一坐标数据的正确性作出判断，并对坐标数据进行优化，进一步提高音频采集设备坐标数据的精确度。

29.

发明授权
一种相机姿态信息确定的方法及相关装置有权

公开(公告)号：CN109215077B

公开(公告)日：2022-12-06

申请号：CN201710552105.1

申请日：2017-07-07

申请人： 腾讯科技(深圳)有限公司

发明人： 林祥凯 , 暴林超 , 刘威

IPC分类号： G06T7/73

摘要： 本发明实施例公开了一种相机姿态信息确定的方法，包括：获取第一图像、第二图像以及模板图像；从模板图像的每个图像层中分别提取第一特征点，并在原始图像层中确定第一特征点；将第一特征点与第二特征点进行匹配，以在原始图像层的每个栅格中确定一个目标特征点，目标特征点用于确定第一单应矩阵；根据第一图像中的第一光流特征点和第二图像的第二光流特征点确定第一目标单应矩阵，并根据第一目标单应矩阵和模板图像中的第三光流特征点确定第二单应矩阵；根据第一单应矩阵与第二单应矩阵确定相机姿态信息。本发明还提供一种相机姿态信息确定装置。本发明实施例可以在保证运行效率的情况下，利用目标特征点可以获取到精度较高的相机姿态信息。

30.

发明授权
对抗测试看图说话系统的方法和相关装置有权

公开(公告)号：CN110188620B

公开(公告)日：2022-11-04

申请号：CN201910381831.0

申请日：2019-05-08

申请人： 腾讯科技(深圳)有限公司

发明人： 吴保元 , 许焱 , 樊艳波 , 张勇 , 刘威 , 沈复民 , 申恒涛

IPC分类号： G06V10/70 , G06F40/216

摘要： 本公开提供了一种对抗测试看图说话系统的方法及相关装置。该方法包括：构造目标函数；对所述目标函数中具有求最大值符号的算项，指定对抗噪声，基于所述对抗噪声，确定具有求最大值符号的算项最大时算项中的未知变量值，将所述目标函数中所述具有求最大值符号的算项去最大值符号后的部分作为剩余函数，将求出的未知变量值代入所述剩余函数中求解使剩余函数值最小时的对抗噪声，替代之前指定的对抗噪声，反复迭代；将迭代终止后得到的对抗噪声叠加到所述看图说话系统要识别的图片上。本公开实施例不但能够使看图说话系统生成的图像描述语句含有指定的词，还能够指定这些词出现的位置，即在指定的位置出现指定的词。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类