有损编解码器和无损编解码器之间的切换方法和装置

    公开(公告)号:CN118522296A

    公开(公告)日:2024-08-20

    申请号:CN202310152315.7

    申请日:2023-02-17

    摘要: 本申请公开了一种有损编解码器和无损编解码器之间的切换方法和装置,该方法包括:获取上一帧Ti‑1的波形,并将上一帧Ti‑1的波形更新到无损编解码器上输入帧缓存;上一帧Ti‑1的波形由有损编码器进行编码;对无损编码器缓存中的波形进行整数时域加窗混叠消除INT winTDAC,得到第一变换结果,并将第一变换结果更新到无损编解码器上交叠缓存中;获取当前帧Ti的波形,并将当前帧Ti的波形更新到输入帧缓存;对无损编码器缓存中的波形进行整数改进离散余弦变换INTMDCT,得到第二变换结果。通过本申请,可以实现有损编解码器和无损编解码器之间实现实时无感切换,开销小,且不会引入感知噪声。

    语音内容表示提取方法、装置、终端设备以及存储介质

    公开(公告)号:CN118430578A

    公开(公告)日:2024-08-02

    申请号:CN202310074493.2

    申请日:2023-01-31

    发明人: 雷延强

    摘要: 本发明实施例公开了一种语音内容表示提取方法、装置、终端设备以及存储介质。本发明实施例预先使用韵律结构被破坏的语音信号对自编码器进行训练,以使自编码器能够从输入的语音信号中提取出语音内容表示,而忽略语音信号中的韵律结构。后续在提取原始语音信号时,首先从原始语音信号提取出第一梅尔频谱,并将第一梅尔频谱输入到设置好的自编码器,利用自编码器将与说话人相关的语音表示转换为说话人无关的语音内容表示,从而得到包括有原始语音信号的语音内容表示的目标语音内容向量。本发明实施例的自编码器在接收到语音信号后,能够忽略语音信号中的韵律信息,提取出与说话人无关的语音内容表示,提高了语音说话内容的提取效果。

    一种用于听障儿童的多模态音乐转化方法及系统

    公开(公告)号:CN118314858A

    公开(公告)日:2024-07-09

    申请号:CN202410571321.0

    申请日:2024-05-10

    摘要: 本发明公开了一种用于听障儿童的多模态音乐转化方法及系统,方法包括:接收目标音乐的音频信号;利用快速傅里叶变换分析所述音频信号,得到不同频率的能量强度值;根据所述能量强度值,确定音乐的节奏特征信息,并将所述能量强度值转换为体现音乐节奏的可视化效果画面;根据所述节奏特征信息控制步进电机,以使所述步进电机的振动与音乐节奏实现同步。利用本发明实施例,能够将音乐的节奏旋律准确地转化为视觉图像和触感振动,实现音乐信息的全面且同步的多模态表达,并在技术上保证音乐信息转换的同步性和准确性。

    处理音频数据的方法、装置、设备和存储介质

    公开(公告)号:CN118038880A

    公开(公告)日:2024-05-14

    申请号:CN202311804028.6

    申请日:2023-12-25

    摘要: 本申请属于音频技术领域,公开了一种处理音频数据的方法、装置、设备和存储介质,其中,所述方法包括:使用第一音频编码器将原始格式的音频数据编码为第一格式,得到第一格式的音频数据;将第一格式的音频数据存储到存储器中;当需要传输或播放音频时,从存储器中检索对应的第一格式的音频数据,作为目标音频数据;使用第一音频解码器将目标音频数据解码回原始格式,得到解码后的音频数据;使用第二音频编码器将解码后的音频数据编码为第二格式,得到第二格式的音频数据;其中,所述第一音频编码器比所述第二音频编码器的比特率要低;传输或播放第二格式的音频数据。本申请能够在有限的存储空间中有效地存储音频数据,同时提供高质量的音频输出。

    对编码音频信号解码的解码器和编码音频信号的编码器

    公开(公告)号:CN112786061B

    公开(公告)日:2024-05-07

    申请号:CN202110100367.0

    申请日:2016-03-08

    摘要: 示出了用于对编码音频信号4进行解码的解码器2的示意框图。解码器包括自适应频谱时间转换器6和重叠相加处理器8。自适应频谱时间转换器例如通过频率时间变换将连续的频谱值块4’转换成连续的时间值块10。此外,自适应频谱时间转换器6接收控制信息12,并且响应于控制信息12,在第一组变换核中的变换核与第二组变换核中的变换核之间进行切换,其中第一组变换核包括在核的侧面具有不同对称性的一个或多个变换核,第二组变换核包括在变换核的侧面具有相同对称性的一个或多个变换核。此外,重叠相加处理器8将连续的时间值块10重叠相加,以获得可以作为解码音频信号的经解码的音频值14。