Patent search ap:("腾讯科技(深圳)有限公司") AND inv:"尹坤" Page 1

1.

发明公开
文本信息识别方法和文本信息识别模型的训练方法审中-公开

公开(公告)号：CN116978030A

公开(公告)日：2023-10-31

申请号：CN202310823027.X

申请日：2023-07-05

Applicant: 腾讯科技(深圳)有限公司

Inventor： 曹浩宇 , 保长存 , 陈皇 , 尹坤 , 姜德强 , 刘银松

IPC: G06V30/19 , G06V30/18 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/084

Abstract: 本申请涉及一种基于人工智能技术的文本信息识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：对待识别图像进行视觉编码处理，得到待识别图像的目标特征图，目标特征图中包括多个视觉特征；获取关于待识别图像的问题文本，并基于多个视觉特征对问题文本进行问题解码处理，得到问题文本的文本特征；确定多个视觉特征分别与文本特征之间的相关度；基于相关度从多个视觉特征中筛选出目标视觉特征，并基于目标视觉特征进行解码处理，以从待识别图像中识别出与问题文本所指示的问题对应的文本信息。采用本方法能够提高文本信息识别准确性。

2.

发明授权
音频编码和解码方法、装置、设备、存储介质和产品有权

公开(公告)号：CN118609581B

公开(公告)日：2024-10-22

申请号：CN202411098135.6

申请日：2024-08-12

Applicant: 腾讯科技(深圳)有限公司

Inventor： 陈皇 , 尹坤 , 郭智豪

IPC: G10L19/038 , G10L19/00

Abstract: 本申请涉及一种音频编码和解码方法、装置、设备、存储介质和产品。所述方法包括：获取待编码音频中各音频帧的音频特征；将音频特征进行拆分，得到各音频帧的第一类拆分特征和各音频帧的第二类拆分特征，第一类拆分特征的信息量大于第二类拆分特征的信息量；将各音频帧的第一类拆分特征按照各音频帧的帧间相关性进行合并，得到第一类拆分特征对应的帧间合并特征；将帧间合并特征进行矢量量化映射，得到合并量化特征，并将各音频帧的第二类拆分特征进行矢量量化映射，得到目标量化特征；基于合并量化特征和目标量化特征进行编码转换，得到待编码音频的音频编码结果。采用本方法能够提高音频编码效率。

3.

发明公开
答案确定方法、装置、电子设备及存储介质审中-公开

公开(公告)号：CN117556900A

公开(公告)日：2024-02-13

申请号：CN202311497926.1

申请日：2023-11-10

Applicant: 腾讯科技(深圳)有限公司

Inventor： 尹坤 , 陈皇 , 姜德强 , 曹浩宇

IPC: G06N5/04 , G06V20/62 , G06V30/262 , G06F18/24 , G06F18/27 , G06F18/22

Abstract: 本申请公开了一种答案确定方法、装置、电子设备及存储介质。本申请的实施例涉及人工智能的机器学习以及云技术等技术领域。该方法包括：对目标图像进行文本提取，得到文本提取结果，文本提取结果包括目标图像中的目标文本；根据文本提取结果、针对目标图像提出的问题文本和目标图像，确定编码输入序列；对编码输入序列进行编码处理，得到编码特征序列；根据编码特征序列进行答案位置预测，确定答案位置预测结果，答案位置预测结果用于在目标文本中确定候选答案片段；根据候选答案片段进行答案解码，得到针对问题文本的答案文本。根据本申请的方法，减少了答案解码过程需要进行处理的文本的数量，大大提高了答案文本的生成效率。

4.

发明公开
答案生成方法、装置、电子设备及存储介质审中-公开

公开(公告)号：CN117473055A

公开(公告)日：2024-01-30

申请号：CN202311162010.0

申请日：2023-09-08

Applicant: 腾讯科技(深圳)有限公司

Inventor： 王宇波 , 姜德强 , 尹坤

IPC: G06F16/332 , G06N3/0455 , G06N3/045 , G06V30/148

Abstract: 本申请公开了一种答案生成方法、装置、电子设备及存储介质，可以应用于云技术、人工智能、智慧交通、车联网等各种场景，所述方法包括：确定目标信息拼接结果；将目标信息拼接结果输入答案预测模型，生成目标答案文本；其中，答案预测模型的训练方法包括：将样本信息拼接结果输入待训练多模态编码器得到样本上下文特征；将样本序列起始单词以及样本问题文本对应的样本答案文本，输入待训练解码器的第一预设注意力层，得到样本掩码特征；将样本上下文特征以及样本掩码特征，输入待训练解码器的第二预设注意力层，得到样本答案预测结果；基于样本答案预测结果与样本答案文本之间的差异，得到答案预测模型。本申请提高了模型预测答案的准确率。

5.

发明公开
音频编码和解码方法、装置、设备、存储介质和产品有权

公开(公告)号：CN118609581A

公开(公告)日：2024-09-06

申请号：CN202411098135.6

申请日：2024-08-12

Applicant: 腾讯科技(深圳)有限公司

Inventor： 陈皇 , 尹坤 , 郭智豪

IPC: G10L19/038 , G10L19/00

Abstract: 本申请涉及一种音频编码和解码方法、装置、设备、存储介质和产品。所述方法包括：获取待编码音频中各音频帧的音频特征；将音频特征进行拆分，得到各音频帧的第一类拆分特征和各音频帧的第二类拆分特征，第一类拆分特征的信息量大于第二类拆分特征的信息量；将各音频帧的第一类拆分特征按照各音频帧的帧间相关性进行合并，得到第一类拆分特征对应的帧间合并特征；将帧间合并特征进行矢量量化映射，得到合并量化特征，并将各音频帧的第二类拆分特征进行矢量量化映射，得到目标量化特征；基于合并量化特征和目标量化特征进行编码转换，得到待编码音频的音频编码结果。采用本方法能够提高音频编码效率。

Patent Agency Ranking