-
公开(公告)号:CN103248992A
公开(公告)日:2013-08-14
申请号:CN201210027677.5
申请日:2012-02-08
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: H04R29/00
Abstract: 本发明涉及一种基于双麦克风的目标方向语音活动检测方法及系统,包含:步骤101)获取两通道每个时频点上的相位差信息;步骤102)输入感兴趣的目标方向区域,计算目标方向区域所对应的相位差范围;步骤103)依据确定的各时频点的相位差信息及目标方向相位差范围,确定步骤101)的各时频点上的信号是否来自于目标方向范围内;步骤104)将第k帧开始的L帧语音信号作一个分析窗,每帧信号有Q个频率点,如果分析窗内的每个频率点分量有不少于μ帧信号在该频率分量上判断属于目标方向,则判断该频率分量上存在目标语音,否则判频率分量上不存在目标语音,如果存在目标语音的频率分量的个数超过阈值ξ,则将该分析窗内的连续L帧信号最终判断为存在目标语音。
-
公开(公告)号:CN103186658A
公开(公告)日:2013-07-03
申请号:CN201210568270.3
申请日:2012-12-24
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G06F17/30
Abstract: 本发明提供一种用于英语口语考试自动评分的参考语法生成方法和设备。该方法包括:人工编写少量基于ABNF规则的参考语法;利用单词发音词表,将基于ABNF规则的参考语法转译成音素词图;对音素词图做以元音音素为断点的音素链切分操作,构成基础音素链集中的音素链;计算基础音素链集中的音素链与考生语音数据音素链集中的音素链的编辑距离;以编辑距离为特征,对考生语音数据音素链集进行聚类,计算同类音素链的出现频率占总数的比例;剔除中占比小的音素链,将保留下来的音素链用音素链连接算法连接成完整的语法句式,最后以树结构的音素词图保存为参考答案。本发明的方法在构造参考语法的过程中只需少量的人工干预,大大减少了口语自动评分中的人工工作量,并减少了不相关人工干预对系统的不良影响。
-
公开(公告)号:CN102790931A
公开(公告)日:2012-11-21
申请号:CN201110131950.4
申请日:2011-05-20
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明涉及一种三维声场合成中的距离感合成方法,该方法首先设定待合成的房间的混响时间和房间的长宽高;亦或利用声压级测量待重放的房间的混响时间,以及房间长宽高;其次,进行扬声器频率响应测量,并根据公式获得反射系数βi;最后,根据设定的各个扬声器和声源在房间中的位置坐标,得到相应的每个扬声器的激励函数:式中,P(x,ω)为有界区域V中合成的声压;Ssw(ω)为源信号频域表达式;至此,建立了房间声学与传统的WFS技术之间的联系,最终利用该激励函数使得三维合成声场具有方向感而且具有距离感。
-
公开(公告)号:CN101645271B
公开(公告)日:2011-12-07
申请号:CN200810240811.3
申请日:2008-12-23
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明提供一种发音质量评估系统中的置信度快速求取方法,包括:预处理分帧;提取每帧语音的语音特征;根据全音节循环网络状态图、精细声学模型和语音特征向量进行解码,得到最优路径上的各音素分割点信息;根据精细声学模型和对应帧的PLP特征向量,对目标音素和语音帧做强制对齐处理,获得每一帧语音对应的状态号,并计算各帧语音对应其相应状态的似然概率值;引入粗略的背景模型,计算每帧语音在该模型包含的所有状态下的似然概率和;计算每一帧待评估语音的广义后验概率;计算每个音素的广义后验概率并将其作为置信度得分。本发明的方法,采用粗糙的背景模型作为后验概率分母部分计算的依据,从而极大降低广义后验概率即置信度得分的计算量。
-
公开(公告)号:CN101447182B
公开(公告)日:2011-11-09
申请号:CN200810097981.0
申请日:2008-05-21
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明涉及一种快速可在线应用的声道长度归整方法,包括如下步骤:1)在训练阶段训练一个与声道长度无关的归整后的声学模型;2)根据不同的归整因子对训练数据分类,训练多类GMM;3)测试时分段在多类GMM打分,快速计算声道长度归整因子;4)根据识别系统的实时性需求选择不同的段数,更新声道长度归整因子;5)用声道长度归整后的声学模型对归整后的声学特征解码。本发明的方法可以根据识别系统对实时性的要求,对测试语音可以选择分段的长度,从而让声道长度归整技术应用于在线的系统中。分段是为了消除判断不准确的静音的影响,又不至于把连续语音按帧拆的太分散而影响声学动态特征差分的值,同时还可以根据段的情况加不同的权重。
-
公开(公告)号:CN1848829B
公开(公告)日:2010-06-16
申请号:CN200510064334.6
申请日:2005-04-14
Applicant: 北京中科信利技术有限公司 , 中国科学院声学研究所
IPC: H04L25/03
Abstract: 本发明涉及一种适应于短波窄带信道的自同步音频水印方法,水印嵌入时,将同步信息和进行了RS编码的水印信息转化为双向码基带信号,然后采用扩频序列嵌入的方法在时间上依次将同步信息和水印信息嵌入音频信号频谱中;水印提取时,使用通信中滑动相关的方法提取同步信息,完成帧同步和数据同步,然后对接收信号的频谱进行相关检测,提取水印信息。本发明利用同步信号定位音频帧的位置和数据起始,应用双向调制技术,RS纠错码技术,冗余嵌入,数据重组,和可信度度量等技术增强水印信号的鲁棒性。另外,本发明把同步信号完全嵌入到频域中,使得同步信号和水印信息一样具有很强的鲁棒性,在强噪声的情况下依然能够完成同步。
-
公开(公告)号:CN101123648B
公开(公告)日:2010-05-12
申请号:CN200610089253.6
申请日:2006-08-11
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: H04M3/493
Abstract: 本发明涉及一种电话语音识别中的自适应方法,包括,预处理过程和自适应更新过程;所述预处理过程是根据采集的多个说话人样本数据的性别、口音、年龄特征形成一个决策树,该决策树的每个叶节点中记录一个语音类的高斯混合模型、隐马尔科夫声学模型以及用于目标语音特征参数与声学模型相互匹配的变换矩阵;所述自适应更新过程包括:1)对输入的目标语音进行分类,将目标语音归入一个叶节点或建立一个新的叶节点;2)更新目标语音所在叶节点上的变换矩阵;3)根据变换矩阵更新目标语音的特征参数或/和更新该目标语音所在叶节点上的隐马尔科夫声学模型。本发明的优点是:大大节省了存储空间,加快了计算速度,特别适用于电话语音识别系统。
-
公开(公告)号:CN101645273A
公开(公告)日:2010-02-10
申请号:CN200910088731.5
申请日:2009-07-10
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L21/02
Abstract: 本发明提供一种采样率差异估计与校正系统及其处理方法。该系统包括采样率差异估计模块和采样率校正模块。首先通过采样率差异估计模块,利用改进的相位变换算法IPHAT,求两路信号的互相关函数;然后,计算它们之间的整数点采样率差异;接着进一步采用基于sinc函数内插的方法,获得分数阶的采样率差异;将整数点的采样率差异与分数阶采样率差异相加,即得到两路信号之间的更为精确的采样率差异值;在计算出两路信号之间的采样率差异以后,通过采样率校正模块,利用抽取和内插滤波器对其中一路信号进行重采样校正。该方法可解决ANC/BSS等多通道信号处理算法在实际应用中存在的由于设备或者环境的原因导致标称为同一采样率的多通道信号出现采样率不一致的问题。
-
公开(公告)号:CN101464982A
公开(公告)日:2009-06-24
申请号:CN200910077275.4
申请日:2009-01-21
Applicant: 北京中科信利技术有限公司
Abstract: 本发明涉及音频水印技术,尤其涉及一种基于音频水印的手机支付认证系统及方法。本发明通过将手机终端用户的私密信息作为水印插入手机终端向银行服务器发送的音频信号中;以及在银行服务器处将该作为水印的用户私密信息从含水印的音频信号中提取出来。所述水印信息是手机终端用户的银行账号、账号密码等私密信息。在本发明的一个优选实施例中,将手机终端的手机ID作为水印信息。在本发明的另一个优选实施例中,手机终端及银行服务器具有声纹确认功能。本发明的系统及方法解决了制约手机支付大规模发展的手机支付安全问题,因此具有重要的应用前景和使用价值。
-
公开(公告)号:CN1885288A
公开(公告)日:2006-12-27
申请号:CN200510077748.2
申请日:2005-06-24
Applicant: 北京中科信利技术有限公司
Abstract: 本发明提供从音乐下载系统中搜索音乐的方法及相关系统、设备。在根据本发明的从音乐下载系统中搜索音乐的方法中,所述音乐下载系统存储有音乐数据库,所述音乐下载系统和一个电子手持设备相连,所述方法包括步骤:用户通过所述电子手持设备向所述音乐下载系统提供和所需音乐有关的音乐片断;根据该音乐片断,音乐下载系统利用匹配搜索算法从音乐数据库查找与该音乐片断匹配的音乐;音乐下载系统向所述电子手持设备发送所查找到的音乐或与音乐有关的信息;以及用户通过选择确定所需音乐,并且向音乐下载系统发送确定结果。本发明还可以适用于从铃声下载系统搜索和下载铃声。采用本发明,能够利用歌手姓名和歌曲名称以外的其它方式来实现快速搜索音乐和铃声。
-
-
-
-
-
-
-
-
-