语音区分模型训练方法、装置、计算机设备及存储介质

    公开(公告)号:CN109065027B

    公开(公告)日:2023-05-02

    申请号:CN201810561701.0

    申请日:2018-06-04

    发明人: 涂宏

    IPC分类号: G10L15/06 G10L25/30 G10L15/05

    摘要: 本发明公开了一种语音区分模型训练方法、装置、计算机设备及存储介质。该方法包括:将标准训练语音数据和干扰训练语音数据输入到原始双向循环神经网络模型中进行训练,调整原始双向循环神经网络模型的权值和偏置,获取原始语音区分模型;获取待测试语音数据,待测试语音数据包括等比例配置的标准测试语音数据和干扰测试语音数据;将标准测试语音数据和干扰测试语音数据输入到原始语音区分模型中进行识别,获取识别准确率,若识别准确率大于预设阈值,则原始语音区分模型确定为目标语音区分模型。采用目标语音区分模型对语音进行区分,可以提高语音区分的准确率。

    语音区分方法、装置、计算机设备及存储介质

    公开(公告)号:CN109036470B

    公开(公告)日:2023-04-21

    申请号:CN201810561723.7

    申请日:2018-06-04

    发明人: 涂宏

    摘要: 本发明公开了一种语音区分方法、装置、计算机设备及存储介质。该语音区分方法包括:基于语音活动检测算法处理原始待区分语音数据,获取目标待区分语音数据;基于所述目标待区分语音数据,获取相对应的ASR语音特征;将所述ASR语音特征输入到预先训练好的ASR‑DNN模型中进行区分,获取目标区分结果。采用该语音区分方法可以很好地区分目标语音和干扰语音,在语音数据噪音干扰非常大的情况下,仍然可以进行准确的语音区分。

    基于信号数据筛选的定位方法、电子装置及存储介质

    公开(公告)号:CN107966678B

    公开(公告)日:2019-04-19

    申请号:CN201711071306.6

    申请日:2017-11-03

    发明人: 李刚 涂宏

    IPC分类号: G01S5/02

    摘要: 本发明提出一种基于信号数据筛选的定位方法,该方法包括:接收移动终端上报的多台无线设备的设备信号数据;从所述设备信号数据中提取每台无线设备的信号强度作为特征值,组合特征值生成一个信号强度数组;判断所述信号强度数组中特征值的数量是否小于预设阈值,当大于或等于预设阈值时,保留该信号强度数组,当小于预设阈值时,过滤掉该信号强度数组;将保留的该信号强度数组输入信号数据分类器,判断该信号强度数组是否合理;及,当信号数据分类器输出的结果为合理,按照预设的定位算法,根据该信号强度数组对应的设备信号数据计算所述移动终端的位置坐标。本发明还提出一种电子装置及存储介质。利用本发明,可以提高移动终端的定位精准度。

    基于信号数据筛选的定位方法、电子装置及存储介质

    公开(公告)号:CN107966678A

    公开(公告)日:2018-04-27

    申请号:CN201711071306.6

    申请日:2017-11-03

    发明人: 李刚 涂宏

    IPC分类号: G01S5/02

    CPC分类号: G01S5/0278

    摘要: 本发明提出一种基于信号数据筛选的定位方法,该方法包括:接收移动终端上报的多台无线设备的设备信号数据;从所述设备信号数据中提取每台无线设备的信号强度作为特征值,组合特征值生成一个信号强度数组;判断所述信号强度数组中特征值的数量是否小于预设阈值,当大于或等于预设阈值时,保留该信号强度数组,当小于预设阈值时,过滤掉该信号强度数组;将保留的该信号强度数组输入信号数据分类器,判断该信号强度数组是否合理;及,当信号数据分类器输出的结果为合理,按照预设的定位算法,根据该信号强度数组对应的设备信号数据计算所述移动终端的位置坐标。本发明还提出一种电子装置及存储介质。利用本发明,可以提高移动终端的定位精准度。

    语音区分方法、装置、计算机设备及存储介质

    公开(公告)号:CN108922513B

    公开(公告)日:2023-03-17

    申请号:CN201810561788.1

    申请日:2018-06-04

    发明人: 涂宏

    摘要: 本发明公开了一种语音区分方法、装置、计算机设备及存储介质。该语音区分方法包括:基于语音活动检测算法处理原始待区分语音数据,获取目标待区分语音数据;基于所述目标待区分语音数据,获取相对应的ASR语音特征;将所述ASR语音特征输入到预先训练好的ASR‑RNN模型中进行区分,获取目标区分结果。采用该语音区分方法可以很好地区分目标语音和干扰语音,在语音数据噪音干扰非常大的情况下,仍然可以进行准确的语音区分。

    说话人聚类方法、装置、计算机设备及存储介质

    公开(公告)号:CN109065028A

    公开(公告)日:2018-12-21

    申请号:CN201810592867.9

    申请日:2018-06-11

    发明人: 涂宏

    IPC分类号: G10L15/06 G10L15/08 G10L15/01

    摘要: 本发明公开了一种说话人聚类方法、装置、计算机设备及存储介质,其中,该说话人聚类方法包括:将至少两个待聚类语音按语音时长降序排列;依序将每一待聚类语音与预设声学模型库中每一原始通用语音向量进行语音识别,获取与待聚类语音对应的目标通用语音向量;若待聚类语音在目标通用语音向量中的语音特征相似度不大于预设阈值,则采用待聚类语音进行模型训练,与待聚类语音对应的当前通用语音向量;将当前通用语音向量存储在预设声学模型库中,并将待聚类语音归类到对应的聚类类簇中。本发明通过判定待聚类语音的语音特征相似度不大于预设阈值时,自动生成与待聚类语音对应的当前通用语音向量,提高分类的准确性。

    模型库建立方法、语音识别方法、装置、设备及介质

    公开(公告)号:CN108922543A

    公开(公告)日:2018-11-30

    申请号:CN201810592869.8

    申请日:2018-06-11

    发明人: 涂宏

    IPC分类号: G10L17/04 G10L17/02

    摘要: 本发明公开了一种模型库建立方法、语音识别方法、装置、设备及介质,其中,该模型库建立方法包括:获取训练样本集;若所述训练样本集中原始语音数据的样本数量大于预设阈值,则根据所述原始语音数据提取的训练语音特征建立当前分级模型,根据模型分级逻辑将所述原始语音数据划分成至少两个当前训练子集;若所述当前训练子集的样本数量大于所述预设阈值,将所述当前训练子集更新为所述训练样本集;若所述当前训练子集的样本数量不大于所述预设阈值,则将所述当前训练子集确定为识别数据集。该方法使得识别服务器可根据分级模型库的模型分级逻辑快速匹配出待测语音数据所在的识别数据集,提高语音识别的效率。

    语音增强方法、装置、计算机设备及存储介质

    公开(公告)号:CN108831494A

    公开(公告)日:2018-11-16

    申请号:CN201810529510.6

    申请日:2018-05-29

    发明人: 涂宏

    IPC分类号: G10L21/02 G10L21/0264

    摘要: 本发明公开一种语音增强方法、装置、计算机设备及存储介质,该语音增强方法包括:对原始语音信息进行转换,获取数字语音信号;基于所述数字语音信号,获取汉克尔矩阵;对所述汉克尔矩阵进行奇异值分解运算处理,获取至少两个奇异值;对至少两个所述奇异值进行奇异值分解逆运算,获取目标语音信号。对所述目标语音信号进行还原处理,获取目标语音信息。该语音增强方法能够有效抑制噪声干扰,以提高在语音识别过程中对目标语音信息进行识别的准确率。

    说话人聚类方法、装置、计算机设备及存储介质

    公开(公告)号:CN109065028B

    公开(公告)日:2022-12-30

    申请号:CN201810592867.9

    申请日:2018-06-11

    发明人: 涂宏

    IPC分类号: G10L15/06 G10L15/08 G10L15/01

    摘要: 本发明公开了一种说话人聚类方法、装置、计算机设备及存储介质,其中,该说话人聚类方法包括:将至少两个待聚类语音按语音时长降序排列;依序将每一待聚类语音与预设声学模型库中每一原始通用语音向量进行语音识别,获取与待聚类语音对应的目标通用语音向量;若待聚类语音在目标通用语音向量中的语音特征相似度不大于预设阈值,则采用待聚类语音进行模型训练,与待聚类语音对应的当前通用语音向量;将当前通用语音向量存储在预设声学模型库中,并将待聚类语音归类到对应的聚类类簇中。本发明通过判定待聚类语音的语音特征相似度不大于预设阈值时,自动生成与待聚类语音对应的当前通用语音向量,提高分类的准确性。

    通用向量训练方法、语音聚类方法、装置、设备及介质

    公开(公告)号:CN108922544B

    公开(公告)日:2022-12-30

    申请号:CN201810592871.5

    申请日:2018-06-11

    发明人: 涂宏

    摘要: 本发明公开了一种通用向量训练方法、语音聚类方法、装置、设备及介质,其中,该通用向量训练方法包括:获取携带同一类簇标识的训练语音数据,提取训练语音数据的训练语音特征;采用简化模型算法简化处理训练语音特征,获取简化语音特征;采用最大期望算法迭代简化语音特征,获取总体变化子空间;将简化语音特征投影到总体变化子空间,以获取类簇标识对应的通用i‑vector向量。采用简化模型算法简化处理训练语音特征获取简化语音特征后,进一步处理后可得更为纯净和简单的通用i‑vector向量,用以降低进行语音聚类方法时的复杂性,同时加快语音聚类方法的识别效率。