-
公开(公告)号:CN116978030A
公开(公告)日:2023-10-31
申请号:CN202310823027.X
申请日:2023-07-05
Applicant: 腾讯科技(深圳)有限公司
IPC: G06V30/19 , G06V30/18 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本申请涉及一种基于人工智能技术的文本信息识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:对待识别图像进行视觉编码处理,得到待识别图像的目标特征图,目标特征图中包括多个视觉特征;获取关于待识别图像的问题文本,并基于多个视觉特征对问题文本进行问题解码处理,得到问题文本的文本特征;确定多个视觉特征分别与文本特征之间的相关度;基于相关度从多个视觉特征中筛选出目标视觉特征,并基于目标视觉特征进行解码处理,以从待识别图像中识别出与问题文本所指示的问题对应的文本信息。采用本方法能够提高文本信息识别准确性。
-
公开(公告)号:CN118609581B
公开(公告)日:2024-10-22
申请号:CN202411098135.6
申请日:2024-08-12
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L19/038 , G10L19/00
Abstract: 本申请涉及一种音频编码和解码方法、装置、设备、存储介质和产品。所述方法包括:获取待编码音频中各音频帧的音频特征;将音频特征进行拆分,得到各音频帧的第一类拆分特征和各音频帧的第二类拆分特征,第一类拆分特征的信息量大于第二类拆分特征的信息量;将各音频帧的第一类拆分特征按照各音频帧的帧间相关性进行合并,得到第一类拆分特征对应的帧间合并特征;将帧间合并特征进行矢量量化映射,得到合并量化特征,并将各音频帧的第二类拆分特征进行矢量量化映射,得到目标量化特征;基于合并量化特征和目标量化特征进行编码转换,得到待编码音频的音频编码结果。采用本方法能够提高音频编码效率。
-
公开(公告)号:CN117556900A
公开(公告)日:2024-02-13
申请号:CN202311497926.1
申请日:2023-11-10
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种答案确定方法、装置、电子设备及存储介质。本申请的实施例涉及人工智能的机器学习以及云技术等技术领域。该方法包括:对目标图像进行文本提取,得到文本提取结果,文本提取结果包括目标图像中的目标文本;根据文本提取结果、针对目标图像提出的问题文本和目标图像,确定编码输入序列;对编码输入序列进行编码处理,得到编码特征序列;根据编码特征序列进行答案位置预测,确定答案位置预测结果,答案位置预测结果用于在目标文本中确定候选答案片段;根据候选答案片段进行答案解码,得到针对问题文本的答案文本。根据本申请的方法,减少了答案解码过程需要进行处理的文本的数量,大大提高了答案文本的生成效率。
-
公开(公告)号:CN117473055A
公开(公告)日:2024-01-30
申请号:CN202311162010.0
申请日:2023-09-08
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06N3/0455 , G06N3/045 , G06V30/148
Abstract: 本申请公开了一种答案生成方法、装置、电子设备及存储介质,可以应用于云技术、人工智能、智慧交通、车联网等各种场景,所述方法包括:确定目标信息拼接结果;将目标信息拼接结果输入答案预测模型,生成目标答案文本;其中,答案预测模型的训练方法包括:将样本信息拼接结果输入待训练多模态编码器得到样本上下文特征;将样本序列起始单词以及样本问题文本对应的样本答案文本,输入待训练解码器的第一预设注意力层,得到样本掩码特征;将样本上下文特征以及样本掩码特征,输入待训练解码器的第二预设注意力层,得到样本答案预测结果;基于样本答案预测结果与样本答案文本之间的差异,得到答案预测模型。本申请提高了模型预测答案的准确率。
-
公开(公告)号:CN118609581A
公开(公告)日:2024-09-06
申请号:CN202411098135.6
申请日:2024-08-12
Applicant: 腾讯科技(深圳)有限公司
IPC: G10L19/038 , G10L19/00
Abstract: 本申请涉及一种音频编码和解码方法、装置、设备、存储介质和产品。所述方法包括:获取待编码音频中各音频帧的音频特征;将音频特征进行拆分,得到各音频帧的第一类拆分特征和各音频帧的第二类拆分特征,第一类拆分特征的信息量大于第二类拆分特征的信息量;将各音频帧的第一类拆分特征按照各音频帧的帧间相关性进行合并,得到第一类拆分特征对应的帧间合并特征;将帧间合并特征进行矢量量化映射,得到合并量化特征,并将各音频帧的第二类拆分特征进行矢量量化映射,得到目标量化特征;基于合并量化特征和目标量化特征进行编码转换,得到待编码音频的音频编码结果。采用本方法能够提高音频编码效率。
-
-
-
-