基音估计
    102.
    发明授权

    公开(公告)号:CN102598119B

    公开(公告)日:2014-12-03

    申请号:CN201080021855.2

    申请日:2010-04-07

    IPC分类号: G10L25/90 G10L19/005

    摘要: 一种用于估计信号的基音周期的方法和装置。该方法包括:通过仅在潜在基音周期的第一范围上执行搜索来识别第一候选基音周期。该方法还包括:通过将第一候选基音周期除以整数来确定第二候选基音周期,其中,第二候选基音周期在潜在基音周期的第一范围之外。该方法还包括:选择候选基音周期中的较小者作为信号的基音周期的估计,该候选基音周期中的较小者使得以此候选基音周期分离的信号部分被良好相关。

    一种基音检测的方法和装置

    公开(公告)号:CN102842305B

    公开(公告)日:2014-06-25

    申请号:CN201110170075.0

    申请日:2011-06-22

    IPC分类号: G10L25/90

    CPC分类号: G10L19/02 G10L25/90

    摘要: 本发明公开了一种基音检测的方法和装置,属于语音与音频领域。该基音检测的方法,包括:在时域对所述语音信号进行基音检测,得到初始基音周期;将所述语音信号转换到频域,获得语音信号的频谱,该频谱包括频谱的幅度谱;根据初始基音周期和所述语音信号的频谱提取特征参数;根据初始基音周期和特征参数进行精细基音周期检测,得到精细基音周期。

    音频合成方法、装置、设备、存储介质和程序产品

    公开(公告)号:CN118553254B

    公开(公告)日:2024-11-05

    申请号:CN202411018524.3

    申请日:2024-07-26

    发明人: 梁芸浩 刘锐

    摘要: 本公开涉及一种音频合成方法、装置、设备、存储介质和程序产品,涉及数据处理技术领域,该方法包括:通过获取待处理音频的原始合成数据,该原始合成数据包括目标伴奏、目标基音特征和目标干净音频,目标基音特征和目标干净音频基于待处理音频得到,并通过目标合成模型对原始合成数据进行处理,得到目标合成音频,该目标合成模型基于多个样本合成数据训练基础合成模型得到,样本合成数据包括样本伴奏、样本基音特征、样本干净音频以及真实合成音频。以便使该目标合成模型能够基于用户的目标伴奏、目标基音特征和目标干净音频,生成更加自然且更加接近用户的真实声音的歌声。

    基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质

    公开(公告)号:CN118471253B

    公开(公告)日:2024-10-11

    申请号:CN202410917115.0

    申请日:2024-07-10

    摘要: 本发明提供了基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质,包括:进行音调移位,将输入音频进行音调移位,以改变音频的频率并引发ASR系统的初步误识别;使用语音活动检测识别音频中的活跃语音片段,生成二进制掩码以标识这些片段;进行稀疏噪声生成;将优化后的扰动向量与掩码向量相结合,生成最终的对抗性音频样本,使其能够有效攻击ASR系统并且难以被人耳察觉。本发明实现了在保持对抗性音频可听性的同时,简化攻击过程并提高了对抗性噪声的隐蔽性和有效性。