VOICE ANALYSIS METHOD AND DEVICE, VOICE SYNTHESIS METHOD AND DEVICE AND MEDIUM STORING VOICE ANALYSIS PROGRAM
    31.
    发明公开
    VOICE ANALYSIS METHOD AND DEVICE, VOICE SYNTHESIS METHOD AND DEVICE AND MEDIUM STORING VOICE ANALYSIS PROGRAM 有权
    语音分析方法和装置,语音合成方法和设备以及介质其上具有语音分析程序存储

    公开(公告)号:EP2980786A1

    公开(公告)日:2016-02-03

    申请号:EP15185625.9

    申请日:2014-08-07

    发明人: TACHIBANA, Makoto

    摘要: A voice synthesis method comprises generating a relative pitch transition (CR) based on synthesis-purpose music track data (YB) and singing characteristic data (Z). The singing characteristics data (Z) comprises a first singing characteristics data (Z1) including a first decision tree T1[n] and a second singing characteristics data (Z2) including a second decision tree T2[n]. The first singing characteristics data (Z1) and the second singing characteristics data (Z2) are mixed. The relative pitch transition (CR) is generated corresponding to the synthesis-purpose music track data (YB) and the mixed singing characteristics data based on a model (M). The first decision tree (T1[n]) and the second decision tree (T2[n]) differ in at least one of size, structure, and classification.

    摘要翻译: 一种语音合成方法,包括基于合成目的的音乐曲目数据(YB)和歌唱特征数据(Z)的相对音调过渡(CR)。 的歌唱特征数据(Z)包括:第一歌唱特征数据(Z1),其包括第一判决树T1 [n]和第二歌唱特征数据(Z2)包括第二决策树T2 [n]的。 第一歌唱特征数据(Z1)和第二歌唱特征数据(Z2)被混合。 相对音调过渡(CR)产生对应于基于模型(M)合成目的的音乐曲目数据(YB)和混合的歌唱特性的数据。 第一判决树(T1 [n]的)和第二决策树(T2 [n])的分化成大小,结构和分类中的至少一个。

    Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems
    35.
    发明公开
    Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems 有权
    技术用于由导航系统来将声信号输出

    公开(公告)号:EP2592623A3

    公开(公告)日:2013-07-17

    申请号:EP12007601.3

    申请日:2012-11-08

    发明人: Warnke, Andreas

    CPC分类号: G10L13/06 G10L13/027

    摘要: Es wird eine Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems vorgestellt, wobei das Navigationssystem zumindest eine Datenbank und eine akustische Ausgabeeinrichtung umfasst. Ein Verfahrensaspekt der Technik umfasst die Schritte Speichern einer Vielzahl von Phonemen in einem ersten Zustand in der zumindest einen Datenbank, Auswählen zumindest eines der Vielzahl von Phonemen auf der Grundlage eines im Rahmen einer Routenführung empfangenen Steuersignals, Bestimmen eines gewünschten zweiten Zustands des zumindest einen ausgewählten Phonems auf der Grundlage des empfangenen Steuersignals, Ändern zumindest eines Teils des ausgewählten Phonems, um das ausgewählte Phonem in den spezifizierten zweiten Zustand zu überführen, auf der Grundlage eines Regelwerks, und Umwandeln des Phonems in dem zweiten Zustand in ein akustisches Signal zur Ausgabe aus der akustischen Ausgabeeinrichtung.

    Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems

    公开(公告)号:EP2592623A2

    公开(公告)日:2013-05-15

    申请号:EP12007601.3

    申请日:2012-11-08

    发明人: Warnke, Andreas

    IPC分类号: G10L13/06 G10L13/027

    CPC分类号: G10L13/06 G10L13/027

    摘要: Es wird eine Technik zur Ausgabe eines akustischen Signals mittels eines Navigationssystems vorgestellt, wobei das Navigationssystem zumindest eine Datenbank und eine akustische Ausgabeeinrichtung umfasst. Ein Verfahrensaspekt der Technik umfasst die Schritte Speichern einer Vielzahl von Phonemen in einem ersten Zustand in der zumindest einen Datenbank, Auswählen zumindest eines der Vielzahl von Phonemen auf der Grundlage eines im Rahmen einer Routenführung empfangenen Steuersignals, Bestimmen eines gewünschten zweiten Zustands des zumindest einen ausgewählten Phonems auf der Grundlage des empfangenen Steuersignals, Ändern zumindest eines Teils des ausgewählten Phonems, um das ausgewählte Phonem in den spezifizierten zweiten Zustand zu überführen, auf der Grundlage eines Regelwerks, und Umwandeln des Phonems in dem zweiten Zustand in ein akustisches Signal zur Ausgabe aus der akustischen Ausgabeeinrichtung.

    摘要翻译: 该方法涉及以例如状态存储音素。 在数据库(2001)中提名国家。 基于在路线引导的上下文中接收的控制信号来选择音素之一。 另一个期望状态例如 基于所接收的控制信号确定所选择的音素的基本状态。 所选择的音素的一部分被改变,以便基于一组规则将选定的音素转移到指定的后一阶段。 在后一状态的音素被转换成声信号,以便由声输出装置(2002)即扬声器输出。 独立权利要求还包括以下内容:(1)计算机程序产品,包括用于执行用于由导航系统(2)输出声信号的方法的指令,用于由导航系统输出声信号的装置。

    CODING, MODIFICATION AND SYNTHESIS OF SPEECH SEGMENTS
    37.
    发明公开
    CODING, MODIFICATION AND SYNTHESIS OF SPEECH SEGMENTS 有权
    加密,修改和语段合成

    公开(公告)号:EP2517197A1

    公开(公告)日:2012-10-31

    申请号:EP10801161.0

    申请日:2010-12-21

    申请人: Telefónica, S.A.

    IPC分类号: G10L13/02 G10L13/06

    摘要: The invention relates to a method for speech signal analysis, modification and synthesis comprising a phase for the location of analysis windows by means of an iterative process for the determination of the phase of the first sinusoidal component and comparison between the phase value of said component and a predetermined value, a phase for the selection of analysis frames corresponding to an allophone and readjustment of the duration and the fundamental frequency according to certain thresholds and a phase for the generation of synthetic speech from synthesis frames taking the information of the closest analysis frame as spectral information of the synthesis frame and taking as many synthesis frames as periods that the synthetic signal has. The method allows a coherent location of the analysis windows within the periods of the signal and the exact generation of the synthesis instants in a manner synchronous with the fundamental period.

    Text-to-speech technology with early emission
    38.
    发明公开
    Text-to-speech technology with early emission 有权
    文字 - 喷泉技术发射

    公开(公告)号:EP2474972A1

    公开(公告)日:2012-07-11

    申请号:EP11150490.8

    申请日:2011-01-10

    申请人: Svox AG

    IPC分类号: G10L13/06 G10L15/12

    CPC分类号: G10L13/06 G10L15/12

    摘要: The method is creating a speech output from a succession of input linguistic target elements including target characteristics, where the speech output is formed by concatenating a sequence of selected waveform units, each selected waveform unit corresponding to an input linguistic target element. The method includes repeating iterative sequences of forward steps, backward steps and the creating of speech output until the forward steps have reached the final target element. The same optimal sequence of selected waveform units for all target elements of a succession of input linguistic target elements starting with an initial target element and ending with a final target element as the standard Viterbi search are emitted but the optimal units become available in a pipelined manner without requiring the calculation of path costs for the final target element and without complete backtracking form the final to the initial target element. The latency, i.e. the amount of computation time before outputting selected waveform units for a beginning part of the target sequence is much shorter than in a Viterbi search.

    摘要翻译: 该方法是从连续的输入语言目标元素创建语音输出,包括目标特征,其中语音输出是通过连接所选择的波形单元序列而形成的,每个所选波形单元对应于输入语言目标元素。 该方法包括重复前进步骤,后向步骤和创建语音输出的迭代序列,直到前进步骤达到最终目标元素。 发射一连串输入语言目标元素的所有目标元素的所选波形单元的相同最佳序列,从初始目标元素开始并以最终目标元素结束作为标准维特比搜索,但是最佳单元以流水线方式可用 而不需要计算最终目标元素的路径成本,并且没有完整的回溯形式到最初的目标元素的最终值。 等待时间,即在目标序列的起始部分输出所选择的波形单位之前的计算时间量比在维特比搜索中短得多。