-
公开(公告)号:CN1753083B
公开(公告)日:2010-05-05
申请号:CN200410078336.6
申请日:2004-09-24
Applicant: 中国科学院声学研究所 , 北京中科信利通信技术有限公司 , 北京中科信利技术有限公司
Abstract: 在根据本发明的语音标记方法中,首先在语音注册阶段,采用由语音识别技术发展而成的语音标记算法,将用户注册时的语音转换成文本进行存储。这样,对于所有待识别的词汇,只需要建立一个识别词表的数据库。在进行识别时,对于用户的发音,按照通用的语音识别系统的流程来进行识别,即提取语音的特征,利用识别词表的信息建立识别语法,基于识别语法和声学模型,对于待识别语音的特征序列在整个候选空间中进行搜索匹配,寻找匹配概率最大的词作为识别结果。本发明还提供了相应的语音标记系统以及采用语音标记的语音识别方法和系统。通过本发明的语音标记方法和系统,能够显著提高语音识别系统的准确度、适应性和灵活性,降低系统所需的存储空间。
-
公开(公告)号:CN1753083A
公开(公告)日:2006-03-29
申请号:CN200410078336.6
申请日:2004-09-24
Applicant: 中国科学院声学研究所 , 北京中科信利通信技术有限公司 , 北京中科信利技术有限公司
Abstract: 在根据本发明的语音标记方法中,首先在语音注册阶段,采用由语音识别技术发展而成的语音标记算法,将用户注册时的语音转换成文本进行存储。这样,对于所有待识别的词汇,只需要建立一个识别词表的数据库。在进行识别时,对于用户的发音,按照通用的语音识别系统的流程来进行识别,即提取语音的特征,利用识别词表的信息建立识别语法,基于识别语法和声学模型,对于待识别语音的特征序列在整个候选空间中进行搜索匹配,寻找匹配概率最大的词作为识别结果。本发明还提供了相应的语音标记系统以及采用语音标记的语音识别方法和系统。通过本发明的语音标记方法和系统,能够显著提高语音识别系统的准确度、适应性和灵活性,降低系统所需的存储空间。
-
公开(公告)号:CN1892647A
公开(公告)日:2007-01-10
申请号:CN200510082715.7
申请日:2005-07-07
Applicant: 中国科学院声学研究所 , 北京中科信利通信技术有限公司
Abstract: 本发明公开了一种用于通过电话按键进行目录搜索的方法和系统。在第一方面,所述方法通过通信终端对用于语音交互应答系统的目录服务器进行目录搜索,通信终端具有数字按键键盘,通信终端和语音交互应答系统之间通过通信网络连接,语音交互应答系统和目录服务器相连,目录服务器存有多个中文或中英文目录,对所述目录建立中文汉字的拼音索引,数字按键和拼音索引的英文字母之间存在映射关系;该方法包括:通信终端接收通过数字按键输入的数字串;通信终端将该数字串通过语音交互应答系统提供给目录服务器;目录服务器根据映射关系和拼音索引,将数字串转换为所述多个目录中的一个。本发明能够让用户在交互式应答系统中快速找到所需的信息。
-
公开(公告)号:CN1744626A
公开(公告)日:2006-03-08
申请号:CN200410074037.5
申请日:2004-09-01
Applicant: 北京中科信利通信技术有限公司 , 北京中科信利技术有限公司
IPC: H04M1/27 , H04M1/2745
Abstract: 本发明披露了一种通讯终端利用无线通讯设备中存储的电话号码进行拨号的拨号方法及相关的通讯终端和无线通讯设备。该方法包括步骤:用户向无线通讯设备输入指令;无线通讯设备根据所述指令,选择电话号码;无线通讯设备基于所述电话号码,产生满足电信系统终端拨号要求的音频拨号信号;无线通讯设备经其音频输出接口向通讯终端的音频输入接口发送音频拨号信号;和通讯终端接收该音频拨号信号并且利用该音频拨号信号进行拨号。本发明的方法能够实现通讯终端的快捷拨号。
-
公开(公告)号:CN1259648C
公开(公告)日:2006-06-14
申请号:CN200410070140.2
申请日:2002-11-15
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明公开一种语音识别系统,包括:模数变换单元,将输入语音的模拟信号变换为数字信号;特征提取单元,对该数字信号进行分帧处理,提取每一帧语音的特征参数,得到其特征矢量序列;特征码本,由一定数量的码字组成;量化编码单元,根据特征码本将输入语音的特征矢量序列转换为特征码字序列;概率表,存储了特征码本中每个码字对应高斯码本中每个码字的概率值;以及解码运算单元,对该特征码字序列进行解码运算得到识别结果,运算中对该特征码字序列中的各个码字,从概率表中直接查找与其具有最大匹配概率的高斯[0]码字。本发明的语音识别系统,可在保证语音系统识别性能的前提下,提高系统的识别速度。
-
公开(公告)号:CN1223985C
公开(公告)日:2005-10-19
申请号:CN02148686.7
申请日:2002-11-15
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L15/00
Abstract: 本发明公开一种语音识别置信度的评价方法及其系统,其评价方法中利用目标单元的隐马尔可夫模型对所述语音段作强制对齐时,生成所述目标单元的状态音素序列及各状态音素对应语音段的起始边界,基于状态音素关于对应语音段中各语音帧的后验概率的计算得到识别结果目标单元的声学置信度量,同时公开了一种并行计算方法和相应的存储结构,本发明的置信度计算是基于更基本的声学结构来进行的,因此可以使置信度评价的结果更为准确有效,更由于采用了并行计算方法及相应的利于并行计算的存储结构,运算速度也大大提高;本发明还公开了一种根据置信度量对识别结果加以标记的方法,以及一种带识别结果置信度评价的听写装置。
-
公开(公告)号:CN1190772C
公开(公告)日:2005-02-23
申请号:CN02148683.2
申请日:2002-11-15
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明公开一种用于语音识别系统的特征矢量集的压缩方法,在对语音特征矢量集聚类得到码本的过程中,增加了根据子集合中矢量数及矢量的总距离度量来动态合并和分裂子集合的步骤,减小了聚类后集合中矢量与其对应的码字的距离度量总和,提高了聚类算法的精度,将本发明方法压缩后的码本应用于语音识别系统中,可在保证语音系统识别性能的同时,大大降低了系统的存储量。本发明还公开一种语音识别系统,用特征码本和概率表代替声学模型,在解码的过程中不需要计算高斯概率,只须从预先存储的概率表中查找出所需的概率值,大大减少了解码运算量,因而可极大地提高系统的识别速度。
-
公开(公告)号:CN1455388A
公开(公告)日:2003-11-12
申请号:CN02148683.2
申请日:2002-11-15
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明公开一种用于语音识别系统的特征矢量集的压缩方法,在对语音特征矢量集聚类得到码本的过程中,增加了根据子集合中矢量数及矢量的总距离度量来动态合并和分裂子集合的步骤,减小了聚类后集合中矢量与其对应的码字的距离度量总和,提高了聚类算法的精度,将本发明方法压缩后的码本应用于语音识别系统中,可在保证语音系统识别性能的同时,大大降低了系统的存储量。本发明还公开一种语音识别系统,用特征码本和概率表代替声学模型,在解码的过程中不需要计算高斯概率,只须从预先存储的概率表中查找出所需的概率值,大大减少了解码运算量,因而可极大地提高系统的识别速度。
-
公开(公告)号:CN1703923A
公开(公告)日:2005-11-30
申请号:CN200380101122.X
申请日:2003-10-17
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
CPC classification number: H04M1/271 , G10L15/26 , G10L2015/027
Abstract: 本发明公开一种具有语音操作系统的便携式数字移动通讯设备及语音操作控制方法,在进行语音识别时是利用特征码本对语音的特征矢量序列进行量化编码,而在解码运算中对有效语音特征码字矢量序列的各个码字,是直接从概率表中查到其在搜索路径上的观察概率;采用本发明,可以在手机中实现全音节的语音识别,无需训练,并可实现汉字语音输入和全音节的语音提示,系统具有语义分析、对话管理和语言生成模块,可以处理复杂的对话过程并产生灵活的提示信息反馈给用户,本发明还可由用户进行语音命令和提示内容的定制。
-
公开(公告)号:CN1567428A
公开(公告)日:2005-01-19
申请号:CN03137014.4
申请日:2003-06-19
Applicant: 北京中科信利技术有限公司 , 中国科学院声学研究所
Abstract: 本发明公开了一种基于数字信号处理的语音变声方法,包括步骤(1)选取需要变声的原始语音信号;(2)得到原始语音信号的基音周期长度;(3)根据基音周期长度定位整个原始语音信号的每一个基音周期的位置;(4)在原始语音信号中的基音周期之间删除/插入基音周期,得到缩短/伸长的语音信号;(5)将缩短/伸长的语音信号线性伸长/压缩至与原始语音信号一致的长度,得到变声后的语音信号。本发明是基于数字信号处理的语音变声方法,该方法简单实用,运算量很小,适于在DSP芯片上实时实现,变声的语音的自然度很高。而且变声后的语音的长度与原始语音长度一致,有利于实时传送变声后的语音信号。
-
-
-
-
-
-
-
-
-