语音合成装置以及语音合成方法

    公开(公告)号:CN103403797A

    公开(公告)日:2013-11-20

    申请号:CN201280010637.8

    申请日:2012-07-12

    CPC classification number: G10L13/02 G10L13/06 G10L13/08 G10L2013/105

    Abstract: 语音合成装置具备:开口度生成部(102),利用表示根据输入的文本生成的音素的种类和该音素在文本中的位置的信息,按根据文本生成的每个音素,以在文本中位于句首的音素的开口度大于位于句末的音素的开口度的方式,生成与口腔内的容积对应的开口度;片段选择部(105),根据存储着各自包含音素的种类、开口度的信息以及语音片段数据的多个片段信息的片段存储部,按根据文本生成的每个音素,基于该音素的种类以及开口度,从存储于片段存储部的多个片段信息之中选择与该音素对应的片段信息;以及合成部(106),利用片段选择部(105)所选择的片段信息以及根据文本生成的韵律信息,生成文本的合成音。

    音质转换装置及音质转换方法

    公开(公告)号:CN101578659B

    公开(公告)日:2012-01-18

    申请号:CN200880001672.7

    申请日:2008-05-08

    Abstract: 一种音质转换装置,利用与输入声音对应的信息来转换输入声音的音质,包括:目标元音声道信息保持部(101),按每个元音来保持目标元音声道信息,所述目标元音声道信息是表示成为目标的音质的元音的声道信息;元音转换部(103),接受被付与了输入声音所对应的音素及音素的时间长度信息的声道信息、即附带音素边界信息的声道信息,将所述附带音素边界信息的声道信息所包含的元音的声道信息的时间变化以第一函数进行近似,将与该元音相同的元音的所述目标元音声道信息保持部(101)所保持的声道信息的时间变化以第二函数进行近似,通过结合所述第一函数和所述第二函数从而求出第三函数,并由所述第三函数生成转换后的元音的声道信息;以及合成部(107),利用由所述元音转换部(103)转换后的元音的声道信息,合成声音。

    声音强调装置及声音强调方法

    公开(公告)号:CN101627427A

    公开(公告)日:2010-01-13

    申请号:CN200880007020.4

    申请日:2008-09-29

    CPC classification number: G10L21/02 G10L21/0232 G10L25/87

    Abstract: 一种声音强调装置,通过使所述的“用力”声音出现在讲话者或用户试图附加强调或者音乐表现的位置上,从而附加由愤怒、兴奋或紧张、精力充沛的说话方式所表现的强调,及附加演歌、布鲁斯歌曲或者摇滚乐等的音乐表现,以实现丰富的声音表现,该声音强调装置包括:强调发音区间检测部(12),检测输入声音波形之中的强调区间,所述强调区间是指发出该输入声音波形的发声者想要使声音波形发生变化的时间区间;以及声音强调部(13),使所述输入声音波形之中的、由所述强调发音区间检测部(12)检测出的所述强调区间所包含的声音波形的振幅包络的波动增加。

    声音合成方法以及声音合成装置

    公开(公告)号:CN1692402A

    公开(公告)日:2005-11-02

    申请号:CN200380100452.7

    申请日:2003-11-25

    CPC classification number: G10L13/07 G10L13/10

    Abstract: 语言处理部(31)分析来自对话处理部(20)的文本,变换为发音以及重音信息;韵律生成部(32)生成对应于来自对话处理部(20)的控制信号的抑扬顿挫模式。波形DB(34)中存储了事先录音的波形数据和对其加入的音调标记的数据;波形分离部(33)从波形DB(34)中分离所期望的音调波形;相位操作部(35)通过将由波形分离部(33)分离的音调波形的相位频谱定型化,除去相位波动,其后根据来自对话处理部(20)的控制信号通过只将高域的相位成分随机扩散加入相位波动。这样得到的音调波形通过波形重叠部(36)以所期望的间隔排列,重叠地配置。

    基频特性曲线产生方法
    7.
    发明授权

    公开(公告)号:CN1220173C

    公开(公告)日:2005-09-21

    申请号:CN98126987.7

    申请日:1998-11-30

    CPC classification number: G10L13/10

    Abstract: 根据该基频特性曲线产生方法,从用音素时间长度或元音和元音对应部分的时间长度标准化的每个重音短语的基频特性曲线的数据库来设定基频特性曲线,当该对应基频特性曲线未存储在该数据库中时,通过内插作为基频特性曲线基准的点之间的间隔产生基频特性曲线。通过该方法,可产生具有比常规方法更高自然性的基频特性曲线。

    音质编辑装置及音质编辑方法

    公开(公告)号:CN101622659A

    公开(公告)日:2010-01-06

    申请号:CN200880001664.2

    申请日:2008-06-04

    CPC classification number: G10L13/033 G10L13/04

    Abstract: 本发明的音质编辑装置包括:音质特征DB(101),记忆多个音质特征;讲话者属性DB(106),关于各个音质特征,记忆用户能够想起的与该音质特征对应的音质的标识符;权重设定部(103),按每个音质的声特征量设定权重;尺度构成部(105),关于各个音质特征,根据构成该音质特征的多个声特征量和权重设定部(103)所设定的权重,算出该音质特征的显示坐标;显示部(107),关于各个音质特征,在算出的显示坐标上显示与该音质特征对应的标识符;位置输入部(108),接受坐标的输入;音质混合部(110),关于多个音质特征的一部分或全部的每一个,通过算出该音质特征的显示坐标与所述接受了的坐标之间的距离,并根据算出的距离的比率,混合多个音质特征的一部分或全部的声特征量,生成新的音质特征。

    感情识别装置
    10.
    发明公开

    公开(公告)号:CN101346758A

    公开(公告)日:2009-01-14

    申请号:CN200780000900.4

    申请日:2007-05-21

    CPC classification number: G10L17/26 G10L2015/025

    Abstract: 提供一种感情识别装置,与音韵信息的个人差别、地方差别、依据语言的差别无关,可以准确且稳定地进行依据声音的感情识别,所述感情识别装置依据输入声音来识别该输入声音的讲话者的感情,包括:特征性音色检测单元,从所述输入声音中检测与特定的感情有关的特征性音色;声音识别单元(106),识别输入声音中包含的音韵的种类;特征性音色检测单元(104),从所述输入声音中检测与特定的感情有关的特征性音色;特征性音色发生指标计算单元(111),根据所述声音识别单元(106)所识别的音韵的种类,按每个音韵计算特征性音色发生指标,该特征性音色发生指标示出所述特征性音色的发生容易度;以及感情判断单元(113),根据所述特征性音色发生指标计算单元(111)所计算的所述特征性音色发生指标来判断在发生了所述特征性音色的音韵中的所述输入声音的讲话者的感情。

Patent Agency Ranking