音频编码和解码方法、装置、设备、存储介质和产品

    公开(公告)号:CN118609581B

    公开(公告)日:2024-10-22

    申请号:CN202411098135.6

    申请日:2024-08-12

    Inventor: 陈皇 尹坤 郭智豪

    Abstract: 本申请涉及一种音频编码和解码方法、装置、设备、存储介质和产品。所述方法包括:获取待编码音频中各音频帧的音频特征;将音频特征进行拆分,得到各音频帧的第一类拆分特征和各音频帧的第二类拆分特征,第一类拆分特征的信息量大于第二类拆分特征的信息量;将各音频帧的第一类拆分特征按照各音频帧的帧间相关性进行合并,得到第一类拆分特征对应的帧间合并特征;将帧间合并特征进行矢量量化映射,得到合并量化特征,并将各音频帧的第二类拆分特征进行矢量量化映射,得到目标量化特征;基于合并量化特征和目标量化特征进行编码转换,得到待编码音频的音频编码结果。采用本方法能够提高音频编码效率。

    答案确定方法、装置、电子设备及存储介质

    公开(公告)号:CN117556900A

    公开(公告)日:2024-02-13

    申请号:CN202311497926.1

    申请日:2023-11-10

    Abstract: 本申请公开了一种答案确定方法、装置、电子设备及存储介质。本申请的实施例涉及人工智能的机器学习以及云技术等技术领域。该方法包括:对目标图像进行文本提取,得到文本提取结果,文本提取结果包括目标图像中的目标文本;根据文本提取结果、针对目标图像提出的问题文本和目标图像,确定编码输入序列;对编码输入序列进行编码处理,得到编码特征序列;根据编码特征序列进行答案位置预测,确定答案位置预测结果,答案位置预测结果用于在目标文本中确定候选答案片段;根据候选答案片段进行答案解码,得到针对问题文本的答案文本。根据本申请的方法,减少了答案解码过程需要进行处理的文本的数量,大大提高了答案文本的生成效率。

    答案生成方法、装置、电子设备及存储介质

    公开(公告)号:CN117473055A

    公开(公告)日:2024-01-30

    申请号:CN202311162010.0

    申请日:2023-09-08

    Abstract: 本申请公开了一种答案生成方法、装置、电子设备及存储介质,可以应用于云技术、人工智能、智慧交通、车联网等各种场景,所述方法包括:确定目标信息拼接结果;将目标信息拼接结果输入答案预测模型,生成目标答案文本;其中,答案预测模型的训练方法包括:将样本信息拼接结果输入待训练多模态编码器得到样本上下文特征;将样本序列起始单词以及样本问题文本对应的样本答案文本,输入待训练解码器的第一预设注意力层,得到样本掩码特征;将样本上下文特征以及样本掩码特征,输入待训练解码器的第二预设注意力层,得到样本答案预测结果;基于样本答案预测结果与样本答案文本之间的差异,得到答案预测模型。本申请提高了模型预测答案的准确率。

    音频编码和解码方法、装置、设备、存储介质和产品

    公开(公告)号:CN118609581A

    公开(公告)日:2024-09-06

    申请号:CN202411098135.6

    申请日:2024-08-12

    Inventor: 陈皇 尹坤 郭智豪

    Abstract: 本申请涉及一种音频编码和解码方法、装置、设备、存储介质和产品。所述方法包括:获取待编码音频中各音频帧的音频特征;将音频特征进行拆分,得到各音频帧的第一类拆分特征和各音频帧的第二类拆分特征,第一类拆分特征的信息量大于第二类拆分特征的信息量;将各音频帧的第一类拆分特征按照各音频帧的帧间相关性进行合并,得到第一类拆分特征对应的帧间合并特征;将帧间合并特征进行矢量量化映射,得到合并量化特征,并将各音频帧的第二类拆分特征进行矢量量化映射,得到目标量化特征;基于合并量化特征和目标量化特征进行编码转换,得到待编码音频的音频编码结果。采用本方法能够提高音频编码效率。

Patent Agency Ranking