一种链路预测模型的训练及链路预测方法

    公开(公告)号:CN106959967A

    公开(公告)日:2017-07-18

    申请号:CN201610018320.9

    申请日:2016-01-12

    Abstract: 本发明提供了一种链路预测模型的训练方法,所述方法包括:步骤S1)对抓取网络数据进行预处理,将预处理后的网络数据提取训练集;步骤S2)对训练集构造的网络进行特征提取,将提取的特征组成特征集;所述特征包括:基于邻居的特征和基于网络游走的特征;步骤S3)对所述特征集用梯度迭代树模型进行特征转换,得到新的多维特征集;步骤S4)将特征集和新的多维特征集进行融合输入链路预测模型,训练得到所述链路预测模型的参数,从而得到训练完毕的链路预测模型。本发明的方法只需要从现有的特征集入手就能扩展特征集的数量;不需要再从网络中提取新的特征,极大地减少了特征提取难度;而且提升了模型的预测性能和鲁棒性。

    一种连续语音流中的叠音检测方法

    公开(公告)号:CN106847267A

    公开(公告)日:2017-06-13

    申请号:CN201510885336.5

    申请日:2015-12-04

    Abstract: 本发明提供了一种连续语音流中的叠音检测方法,所述方法包含:步骤101)通过对语音进行多尺度表示进而得到一种综合特征,再将得到的综合特征输入HMM检测器进行初次判决;步骤102)采用非负矩阵分解对初次判决结果进行二次判决,进而剔除受噪声干扰而导致误判的非叠音段。上述步骤101)进一步包含:步骤101-1)对语音流进行端点检测,去除静音段;步骤101-2)获取语音流的综合特征,所述综合特征包括四种尺度下的语谱图参数表示,以及它们的一阶和二阶差分;步骤101-3)对综合特征包含的特征向量的每一维进行均值和方差归一化处理;步骤101-4)再将步骤101-3)的处理结果输入HMM检测器进行初次判决。

    一种神经网络声学模型训练方法

    公开(公告)号:CN106297773A

    公开(公告)日:2017-01-04

    申请号:CN201510290592.X

    申请日:2015-05-29

    Abstract: 本发明涉及一种神经网络声学模型训练方法,所述方法具体包含:步骤101)搭建基础DNN网络架构,所述DNN网络架构包含:输入层,隐含层和输出层,其中输出层用于输出三音素状态集;步骤102)对输出的三音素状态集聚类,并将聚类后的三音素根据中心音素进行分类,分为中文音素、英文音素及非语音音素三类;步骤103)在输出层增加一组线索结点,该组线索结点分别对应步骤102)对三音素分类得到的三类结果;其中,加入的线索结点与最后一层隐含层全连接,得到最终网络架构;步骤104)针对得到的最终网络架构进行训练,当训练完成后将线索结点从网络中剥离,进而完成针对神经网络声学模型训练,再基于剥离后的网络进行语音识别。

    用于英语口语考试自动评分的参考语法生成方法和设备

    公开(公告)号:CN103186658B

    公开(公告)日:2016-05-25

    申请号:CN201210568270.3

    申请日:2012-12-24

    Abstract: 本发明提供一种用于英语口语考试自动评分的参考语法生成方法和设备。该方法包括:人工编写少量基于ABNF规则的参考语法;利用单词发音词表,将基于ABNF规则的参考语法转译成音素词图;对音素词图做以元音音素为断点的音素链切分操作,构成基础音素链集中的音素链;计算基础音素链集中的音素链与考生语音数据音素链集中的音素链的编辑距离;以编辑距离为特征,对考生语音数据音素链集进行聚类,计算同类音素链的出现频率占总数的比例;剔除中占比小的音素链,将保留下来的音素链用音素链连接算法连接成完整的语法句式,最后以树结构的音素词图保存为参考答案。本发明的方法在构造参考语法的过程中只需少量的人工干预,大大减少了口语自动评分中的人工工作量,并减少了不相关人工干预对系统的不良影响。

    一种基于音视频信息的自动音乐记谱方法及系统

    公开(公告)号:CN103377647B

    公开(公告)日:2015-10-07

    申请号:CN201210122443.9

    申请日:2012-04-24

    Abstract: 本发明涉及一种基于音视频信息的自动音乐记谱方法及系统,所述方法包含:采集钢琴演奏的视频和音频数据;依据采集的视频信息用视频跟踪算法获取手部在钢琴上的所有位置信息,根据所述手部位置信息确定演奏者所演奏的弹奏音符和各弹奏音符对应的弹奏时刻信息,即依据视频采集信息获得钢琴弹奏的音符备选范围序列集,简称“视频音符备选范围序列集”;对采集的音频信息采用音频自动音乐记谱算法获取演奏者所演奏的弹奏音符的基频信息,根据基频信息确定演奏者所演奏的弹奏音符和各弹奏音符对应的弹奏时刻信息;将同步后的视频音符备选范围序列集和音频音符备选范围序列集取交集确定演奏的所有音符及这些音符的各个音符对应的弹奏时刻信息。

    一种用于消除声学回声的自适应滤波器及滤波方法

    公开(公告)号:CN104883462A

    公开(公告)日:2015-09-02

    申请号:CN201410073711.1

    申请日:2014-02-28

    Inventor: 吴超 付强 颜永红

    Abstract: 本发明提出了一种用于消除声学回声的自适应滤波器,所述自适应滤波器采用基于以下目标函数的自适应滤波算法,并采用限制系数对滤波器更新进行限制,且本发明的自适应滤波器每迭代R次对δ(k,m)进行一次更新。本发明克服已有的变步长控制方法的不足,提出一种收敛性能较好、稳态误差小且对双讲情况鲁棒的步长控制方法。该方法基于频域滤波器实现,通过对每次迭代过程中滤波器系数更新进行约束,获得较小的稳态误差和较好的双讲鲁棒性能,同时在频域对约束条件进行更新,提高了滤波器的收敛速度和跟踪速度。

    一种声学模型建立方法及基于该模型的语音解码方法

    公开(公告)号:CN104575497A

    公开(公告)日:2015-04-29

    申请号:CN201310517149.2

    申请日:2013-10-28

    Abstract: 本发明提供了一种声学模型建立方法及基于该模型的语音解码方法,所述方法包含:步骤101)基于训练数据,计算声学模型所需的三因子高斯混合模型的统计量;步骤102)采用自聚类方法根据统计量计算决策树问题集,基于得到的决策树的问题集采用决策树算法对所述统计量进行分割聚类,进而得到同位音素;步骤103)将基础音素集与所述同位音素合并作为含同位音素的音素集,并通过决策树过程对原始语音标注进行处理,处理后的语音标注称为含同位音素的语音标注;步骤104)基于含同位音素的音素集和语音标注,采用声学模型训练方法进行声学模型训练,生成含同位音素的声学模型。本发明将致力于解决黏着语语音识别系统中的高声学模型混淆度问题。

    英语口语考试系统中的朗读题自动评分方法和设备

    公开(公告)号:CN103065626B

    公开(公告)日:2015-03-11

    申请号:CN201210557363.6

    申请日:2012-12-20

    Abstract: 本发明提供一种英语口语朗读自动评分的方法和设备。该方法包括:对输入语音进行预处理,该预处理中包括分帧处理;从预处理的语音中提取语音特征;利用朗读文本搭建的线性语法网络和声学模型,对语音特征向量序列进行强制对齐,得到各音素分割点信息;按照各音素分割点信息,计算每个音素的后验概率;基于音素的后验概率,提取多维评分特征;根据评分特征和人工评分信息,使用支持向量回归法训练非线性回归模型,以便利用该非线性回归模型对英语口语朗读进行评分。使用专家打分数据训练评分模型,从统计上保证了机器评分的结果不会偏离人工评分,从而达到计算机对专家评分的高度模拟。

    一种用于维吾尔语语音识别的识别单元的选择方法及系统

    公开(公告)号:CN103065632B

    公开(公告)日:2014-10-08

    申请号:CN201210560599.5

    申请日:2012-12-21

    Abstract: 本发明实施例涉及一种用于维吾尔语语音识别的词典单元的选择方法及系统。方法包括:为待识别的语音收集/准备相应的文本语料;从文本语料中抽取不同的词语;将所述不同词语输入形态分析器,分析成功时获得相应的词语的分解结果,分析失败时对所述词语进行基于削尾算法的词语分解,从而获得分解结果,以及根据所述分解结果,得到每个词语对应的词干以及附加成分;将所述文本语料中的词语映射为所述词干和附加成分,抽取高频词干和附加成分作为词典单元。本发明实施例根据维吾尔语形态变化的规则,将维吾尔语词语分解为词干和附加成分,然后选择词干和附件成分作为识别单元,从而缓解了识别系统集外词过多的问题,提高了系统的识别率。

Patent Agency Ranking