-
公开(公告)号:CN1317691C
公开(公告)日:2007-05-23
申请号:CN200410006564.2
申请日:2004-05-18
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L21/02
Abstract: 本发明公开一种自适应谷点降噪方法和系统,将二个无指向性传声器输出的一通道采样信号和二通道采样信号,分别减去经过延时的二通道采样信号和一通道采样信号,得到向前、向后两个指向性信号,然后分别这两路信号分解为多个向前和向后子带信号,在自适应滤波器上将相应频带的向后子带信号乘以自适应滤波系数,输出向后子带调整信号,再在加法器上将各频带的向前子带信号减去向后子带调整信号输出,最后由综合滤波器组将多个加法器的输出累加,输出处理完的信号。本发明通过在频率上分带,在几个噪声源分布在不同的频率段并在不同方位的情况下,不同频率段的谷点可以同时对准几个噪声源,确保输出信号中噪声得到抑制。
-
公开(公告)号:CN1284134C
公开(公告)日:2006-11-08
申请号:CN200410070139.X
申请日:2002-11-15
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明公开一种语音识别系统,包括一模数变换单元、一特征提取单元、一解码运算单元及一声学模型,用于接收语音输入信号并得到相匹配的识别结果,其中:该模数变换单元将该语音输入信号转换为一数字信号;该特征提取单元将该数字信号进行分帧处理,提取语音特征参数得输入语音特征矢量序列;该解码运算单元对该特征矢量序列进行解码运算得到识别结果。该声学模型为采用本发明压缩方法得到的高斯码本。本发明的语音识别系统,可在保证语音系统识别性能的前提下,提高系统的识别速度。
-
公开(公告)号:CN1848829A
公开(公告)日:2006-10-18
申请号:CN200510064334.6
申请日:2005-04-14
Applicant: 北京中科信利技术有限公司 , 中国科学院声学研究所
IPC: H04L25/03
Abstract: 本发明涉及一种适应于短波窄带信道的自同步音频水印方法,水印嵌入时,将同步信息和进行了RS编码的水印信息转化为双向码基带信号,然后采用扩频序列嵌入的方法在时间上依次将同步信息和水印信息嵌入音频信号频谱中;水印提取时,使用通信中滑动相关的方法提取同步信息,完成帧同步和数据同步,然后对接收信号的频谱进行相关检测,提取水印信息。本发明利用同步信号定位音频帧的位置和数据起始,应用双向调制技术,RS纠错码技术,冗余嵌入,数据重组,和可信度度量等技术增强水印信号的鲁棒性。另外,本发明把同步信号完全嵌入到频域中,使得同步信号和水印信息一样具有很强的鲁棒性,在强噪声的情况下依然能够完成同步。
-
公开(公告)号:CN1773606A
公开(公告)日:2006-05-17
申请号:CN200410090801.8
申请日:2004-11-12
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明属于语音识别领域,具体的说,涉及一种基于混淆网络的语音解码方法,包括步骤:1)对语音特征进行深度优先帧同步Viterbi-Beam搜索,输出N-Best句子或者词格;2)将N-Best句子或者词格按照时间相似度算法和音素相似度算法进行两级聚类生成混淆网络;3)在混淆网络上以后验概率最大为准则匹配搜索出最优结果。与现有的多遍解码方法相比,本发明在第二遍解码时,不需要更精细复杂的声学模型和语言模型,有效的缩减了网络,提高了解码速率;同时本发明还克服了现有多遍解码系统中解码失误无法修复的缺点。
-
公开(公告)号:CN1773605A
公开(公告)日:2006-05-17
申请号:CN200410090802.2
申请日:2004-11-12
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明涉及一种应用于语音识别系统的语音端点检测方法,包括如下步骤:1)对输入的语音数据进行分帧处理;2)对语音数据以帧为单位进行FFT运算,根据前N帧语音将整个语音频谱划分为信噪比高低不同的子带,计算出各子带的噪声门限;3)根据各子带的噪声门限对语音端点进行初步判别;4)根据共振峰值对语音端点进行精确判定。与现有技术相比,本发明的优点是:能够适用于各种不同自然环境的语音端点检测;能够适用于噪声较大时的语音端点检测;采用逐帧判别,且计算量小,可实际应用于各种实时语音识别系统中。
-
公开(公告)号:CN1212601C
公开(公告)日:2005-07-27
申请号:CN02146655.6
申请日:2002-11-01
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L13/02
Abstract: 本发明公开了一种嵌入式语音合成方法及系统,用于手持数字移动通讯设备的操作系统,通过在该操作系统中加载文本分析模块、码字序列生成模块、语音解码模块输入模块和波形拼接合成模块,可以使输入的文本信息转换成数字语音信号输出。该方法和系统可以充分利用该设备本身的资源,从而大大降低语音合成系统所占用的系统资源。依据本发明的语音合成系统占用的总资源不到500K字节,计算复杂度小于5MIPS,能够运行在当前主流的手机之中。
-
公开(公告)号:CN1201285C
公开(公告)日:2005-05-11
申请号:CN200310115044.0
申请日:2003-11-20
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L15/00
Abstract: 本发明公开了一种语音识别中的并行搜索方法,由多个线程对令牌扩展进行并行运算,各线程按索引单位分配得到各自的t-1时刻词典树的令牌资源,对于分配的t-1时刻的令牌资源,线程Ti对各状态的全局令牌链表中的令牌进行扩展运算,并将新产生的令牌链入目标状态中线程Ti对应的令牌链表中,在所有线程的扩展运算完成后,进行令牌资源的同步运算,本发明方法可在相当程度上实现多处理器系统中处理器间的计算负载平衡。且在并行搜索引擎中令牌扩展线程间的通信开销非常低。
-
公开(公告)号:CN1190773C
公开(公告)日:2005-02-23
申请号:CN02148684.0
申请日:2002-11-15
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L15/00
Abstract: 本发明公开一种用于语音识别系统的特征矢量集的压缩方法,在对语音特征矢量集聚类得到码本的过程中,增加了根据子集合中矢量数及矢量的总距离度量来动态合并和分裂子集合的步骤,减小了聚类后集合中矢量与其对应的码字的距离度量总和,提高了聚类算法的精度,将本发明方法压缩后的码本应用于语音识别系统中,可在保证语音系统识别性能的同时,大大降低了系统的存储量。本发明还公开一种语音识别系统,用特征码本和概率表代替声学模型,在解码的过程中不需要计算高斯概率,只须从预先存储的概率表中查找出所需的概率值,大大减少了解码运算量,因而可极大地提高系统的识别速度。
-
公开(公告)号:CN1503220A
公开(公告)日:2004-06-09
申请号:CN200310115044.0
申请日:2003-11-20
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L15/00
Abstract: 本发明公开了一种语音识别中的并行搜索方法,由多个线程对令牌扩展进行并行运算,各线程按索引单位分配得到各自的t-1时刻词典树的令牌资源,对于分配的t-1时刻的令牌资源,线程Ti对各状态的全局令牌链表中的令牌进行扩展运算,并将新产生的令牌链入目标状态中线程Ti对应的令牌链表中,在所有线程的扩展运算完成后,进行令牌资源的同步运算,本发明方法可在相当程度上实现多处理器系统中处理器间的计算负载平衡。且在并行搜索引擎中令牌扩展线程间的通信开销非常低。
-
公开(公告)号:CN111768796B
公开(公告)日:2024-05-03
申请号:CN202010676232.4
申请日:2020-07-14
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L21/0216 , G10L21/0224 , G10L25/30
Abstract: 本发明实施例公开了一种声学回波消除与去混响方法及装置,方法包括:根据麦克风拾取语音时域信号与扬声器传出的远端说话人语音时域信号,确定与其对应的频域信号;根据麦克风拾取语音频域信号、远端说话人语音频域信号及预置的级联网络中的回波消除阶段神经网络,确定估计掩蔽;根据估计掩蔽、麦克风拾取语音频域信号的幅度谱及预置的级联网络中的去混响阶段神经网络,确定隐掩蔽;根据麦克风拾取语音频域信号的幅度谱、估计掩蔽、隐掩蔽与麦克风拾取语音频域信号的相位,确定估计目标语音时域信号。本发明实施例通过预置的级联网络既抑制麦克风拾取语音时域信号中的回波,又抑制混响,增强了麦克风拾取语音时域信号,保持目标语音的完整。
-
-
-
-
-
-
-
-
-