用于声对声转换的系统和方法

    公开(公告)号:CN111201565B

    公开(公告)日:2024-08-16

    申请号:CN201880034452.8

    申请日:2018-05-24

    IPC分类号: G10L13/00 G10L13/033

    摘要: 一种构建话音转换系统的方法使用来自目标语音的目标信息以及源话音数据。该方法接收源话音数据和在音色空间内的目标音色数据。根据源话音数据和目标音色数据,生成器产生第一候选数据。参照多个不同语音的音色数据,鉴别器将第一候选数据与目标音色数据进行比较。鉴别器确定第一候选数据和目标音色数据之间的不一致性。鉴别器产生包含与不一致性有关的信息的不一致性消息。将不一致性消息反馈给生成器,并且生成器产生第二候选数据。使用由生成器和/或鉴别器产生的作为反馈结果的信息来改进音色空间中的目标音色数据。

    用于ASR数据增强的特征域带宽扩展和频谱重平衡

    公开(公告)号:CN118475979A

    公开(公告)日:2024-08-09

    申请号:CN202280077253.1

    申请日:2022-11-18

    发明人: D·夏尔马

    摘要: 一种处理语音的方法,包括:提供具有第一带宽的音频特征的第一音频数据集;将第一音频数据集下采样至低于第一带宽的第二带宽;由高频重建网络(HFRN)至少基于下采样的音频数据,产生针对第一音频数据集的第一带宽的音频特征的估计;将具有第二带宽的音频特征的第二音频数据集输入到HFRN中;由HFRN基于具有第二带宽的音频特征的第二音频数据集,产生针对第二音频数据集的第一带宽的音频特征的估计;以及使用针对第一和第二音频数据集的第一带宽的音频特征的估计来训练语音处理系统(SPS)。

    一种英语发音教学系统
    4.
    发明公开

    公开(公告)号:CN117854334A

    公开(公告)日:2024-04-09

    申请号:CN202410024349.2

    申请日:2024-01-08

    摘要: 本发明涉及英语教学辅助系统技术领域,尤其涉及一种英语发音教学系统,包括:语音采集模块,用于获取用户针对指定英语文本所发出的原始语音段;语音处理模块,用于针对所述原始语音段进行处理,获取该原始语音段的语音特征;所述语音特征包括:基频、音色、语速、音强、音调、停顿;语音播报模块,用于针对所述指定英语文本和该原始语音段的语音特征,获取标准语音段并进行播放该标准语音段。相对于现有技术而言,其可以根据用户的发音差异和语气要求生成个性化、逼真的标准语音段,提高发音教学的个性化适应性,以及采用基频、音色、语速、音强等多维度的语音特征进行处理,有助于合成语音更贴近真实人类语音,提升合成语音的真实感。

    状况掌握系统、声音应答装置以及状况掌握方法

    公开(公告)号:CN117693789A

    公开(公告)日:2024-03-12

    申请号:CN202180100840.3

    申请日:2021-09-22

    发明人: 鬼头秀一郎

    IPC分类号: G10L13/00

    摘要: 本发明的掌握住所内的对象者的状况的状况掌握系统具备:一个以上的检测传感器,其进行对象者的检测、设置于住所内且状态能够因对象者的动作而变化的设置物的状态的检测、以及住所内的环境的状态的检测中的至少任意一者;声音应答装置,其能够进行包括向对象者的说话的声音应答;以及存储部,其存储信息。声音应答装置以与检测传感器的检测结果相应的内容向对象者说话,使包括说话所伴随的与对象者的会话内容在内的信息存储于存储部中。

    用于多语言通信排序的系统和方法

    公开(公告)号:CN108475503B

    公开(公告)日:2023-09-22

    申请号:CN201580085355.8

    申请日:2015-10-15

    IPC分类号: G10L13/00

    摘要: 本发明提供了一种用于多语言通信排序的系统和方法。通信流可以支持可能需要被创建、移除或编辑的一种或多种语言。在序列编辑期间,可以添加提示、数据、表达式、暂停和文本转语音。这可以通过使用包括提示或TTS的内联选择器完成,或者通过还可以提供错误反馈的对话的使用完成。主序列能够处理被彼此独立地支持和管理的多种语言。

    语音波形生成
    7.
    发明授权

    公开(公告)号:CN111602194B

    公开(公告)日:2023-07-04

    申请号:CN201880085612.1

    申请日:2018-09-30

    IPC分类号: G10L13/00

    摘要: 本公开内容提供了用于生成语音波形的方法和装置。可以接收与输入相关联的基频信息、声门特征和声道特征,其中声门特征包括相位特征、形状特征和能量特征。基于基频信息和声门特征通过第一神经网络模型来生成声门波形。基于声门波形和声道特征通过第二神经网络模型来生成语音波形。

    语音提示方法、记录介质及语音提示系统

    公开(公告)号:CN108093653B

    公开(公告)日:2023-03-28

    申请号:CN201780003014.0

    申请日:2017-04-26

    IPC分类号: G06Q50/30 G10L13/00 G10L13/02

    摘要: 本公开提供能够使用户的舒适性提高的语音提示方法、语音提示程序、语音提示系统以及终端装置。通信部(301)取得由说话者对用户在飞机内播报的播报语音及播报语音的重要度,机内广播优先级控制部(310)根据取得的重要度,判断是否将播报语音提示给用户,机内广播控制部(308)在判断为将播报语音提示给用户的情况下,向用户使用的娱乐终端发送播报语音。

    交流系统
    10.
    发明公开
    交流系统 审中-实审

    公开(公告)号:CN115699719A

    公开(公告)日:2023-02-03

    申请号:CN202180040699.2

    申请日:2021-03-16

    发明人: 挂村笃

    摘要: 【课题】提供使组通话与个别通话协同的交流系统。【解决手段】实施方式的交流系统具备:组通话控制部,进行第1处理和第2处理,第1处理将从移动通信终端接收的发言语音数据向其他多个移动通信终端中的各个移动通信终端进行广播传送,第2处理将通过对接收的发言语音数据进行语音识别处理而得到的发言语音识别结果作为交流履历按照时间序列积蓄,并使得各用户能够同步地观察交流履历;以及个别通话控制部,仅向组通话中的特定的用户发送发言语音数据。具备这些控制部的交流控制部在第1处理的广播传送中,确定仅向特定的用户发送发言语音数据的个别通话模式中的用户,在个别通话模式结束后,进行用于通知在个别通话模式中发生了广播传送的处理。