-
公开(公告)号:CN109036370B
公开(公告)日:2021-07-20
申请号:CN201810576452.2
申请日:2018-06-06
申请人: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
发明人: 赵峰 , 徐海青 , 吴立刚 , 章爱武 , 潘子春 , 李葵 , 李明 , 张引强 , 黄影 , 陈是同 , 徐唯耀 , 秦浩 , 王文清 , 郑娟 , 王维佳 , 秦婷 , 梁翀 , 浦正国 , 张天奇 , 余江斌 , 韩涛 , 杨维 , 张才俊
摘要: 本发明公开了一种说话人语音自适应训练方法,属于语音合成技术领域,包括:给定训练情感语音数据和目标说话人情感语音数据;对声学参数进行表征,并对声学参数的状态输出分布和时长分布进行估计、建模;对训练语音数据模型状态输出分布和平均音模型状态输出分布的差异进行归一化处理,得到目标说话人情感语音数据的平均音模型;对平均音模型进行说话人自适应变换,得到说话人相关的自适应模型。本发明示例的说话人语音自适应训练方法,得到的自适应模型用于语音合成,可以减小语音库中说话人的差异所造成的影响,提高合成语音的情感相似度,只用少量的待合成的情感语料,就能够合成出自然度、流利度、情感相似度都很好的情感语音。
-
公开(公告)号:CN108831435B
公开(公告)日:2020-10-16
申请号:CN201810576165.1
申请日:2018-06-06
申请人: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
发明人: 赵永生 , 吴立刚 , 徐海青 , 陈是同 , 徐唯耀 , 秦浩 , 王文清 , 杨维 , 张才俊 , 孙林檀 , 田诺 , 郑娟 , 秦婷 , 梁翀 , 浦正国 , 张天奇 , 余江斌 , 韩涛 , 潘子春 , 李葵 , 李明 , 张引强 , 黄影
摘要: 本发明公开了一种基于多情感说话人自适应的情感语音合成方法,属于语音合成技术领域,包括:对多说话人情感语音数据模型进行说话人自适应训练,获得多说话人情感语音数据的平均音模型;对平均音模型进行说话人自适应变换,得到说话人相关的自适应模型;得到目标文本的上下文相关的标注文件,并生成相应的语音参数;将语音参数合成得到目标说话人目标情感的语音。本发明示例的语音合成方法,可以减小语音库中说话人的差异所造成的影响,提高合成语音的情感相似度,只用少量的待合成的情感语料,就能够合成出自然度、流利度、情感相似度都很好的情感语音。
-
公开(公告)号:CN109036454A
公开(公告)日:2018-12-18
申请号:CN201810576208.6
申请日:2018-06-06
申请人: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
发明人: 徐海青 , 赵永生 , 吴立刚 , 章爱武 , 陈是同 , 徐唯耀 , 秦浩 , 王文清 , 郑娟 , 秦婷 , 梁翀 , 浦正国 , 张天奇 , 余江斌 , 韩涛 , 杨维 , 张才俊 , 孙林檀 , 田诺 , 潘子春 , 李葵 , 李明 , 张引强 , 黄影
CPC分类号: G10L21/0272 , G06K9/6223 , G06N3/0454 , G10L25/21 , G10L25/27 , G10L25/30
摘要: 本发明公开了一种基于DNN的说话人无关单通道录音分离的方法和系统,属于技术领域,具体步骤包括对训练集的语料进行分词处理,同时对词语进行向量编码,通过分词处理和词语向量编码的过程,用矩阵将一段语句表示出来生成词向量,然后将生成的词向量作为输入样本,输入到卷积神经网络中。本发明提出的组合优化算法在对文本情感特征的自动学习上有着不错的效果,模型的训练速度也大大的提高,分类结果准确度高、自动学习能力强。
-
公开(公告)号:CN109036370A
公开(公告)日:2018-12-18
申请号:CN201810576452.2
申请日:2018-06-06
申请人: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
发明人: 赵峰 , 徐海青 , 吴立刚 , 章爱武 , 潘子春 , 李葵 , 李明 , 张引强 , 黄影 , 陈是同 , 徐唯耀 , 秦浩 , 王文清 , 郑娟 , 王维佳 , 秦婷 , 梁翀 , 浦正国 , 张天奇 , 余江斌 , 韩涛 , 杨维 , 张才俊
摘要: 本发明公开了一种说话人语音自适应训练方法,属于语音合成技术领域,包括:给定训练情感语音数据和目标说话人情感语音数据;对声学参数进行表征,并对声学参数的状态输出分布和时长分布进行估计、建模;对训练语音数据模型状态输出分布和平均音模型状态输出分布的差异进行归一化处理,得到目标说话人情感语音数据的平均音模型;对平均音模型进行说话人自适应变换,得到说话人相关的自适应模型。本发明示例的说话人语音自适应训练方法,得到的自适应模型用于语音合成,可以减小语音库中说话人的差异所造成的影响,提高合成语音的情感相似度,只用少量的待合成的情感语料,就能够合成出自然度、流利度、情感相似度都很好的情感语音。
-
公开(公告)号:CN108986788A
公开(公告)日:2018-12-11
申请号:CN201810576451.8
申请日:2018-06-06
申请人: 国网安徽省电力有限公司信息通信分公司 , 国网信息通信产业集团有限公司 , 安徽继远软件有限公司 , 国家电网有限公司
发明人: 潘子春 , 李葵 , 李明 , 张引强 , 黄影 , 赵峰 , 吴立刚 , 徐海青 , 章爱武 , 陈是同 , 徐唯耀 , 秦浩 , 王文清 , 郑娟 , 秦婷 , 梁翀 , 浦正国 , 张天奇 , 余江斌 , 韩涛 , 杨维 , 张才俊
摘要: 本发明公开了一种基于后验知识监督的噪声鲁棒声学建模方法,属于语音人机交互技术领域,该方法包括:通过老师模型的训练得出干净语音的后验概率分布;以所述干净语音的后验概率分布为标准来监督学生模型的训练,使学生模型无限逼近老师模型的后验概率分布;其中,所述老师模型为干净语音训练的模型,所述学生模型为带噪语音训练的模型。本发明示例的建模方法,建立的声学模型具有较强的环境鲁棒性,表现出优越的抗噪性能。
-
公开(公告)号:CN108763219A
公开(公告)日:2018-11-06
申请号:CN201810576206.7
申请日:2018-06-06
申请人: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
发明人: 吴立刚 , 赵永生 , 赵峰 , 徐海青 , 陈是同 , 徐唯耀 , 秦浩 , 王文清 , 郑娟 , 秦婷 , 梁翀 , 浦正国 , 王维佳 , 张天奇 , 余江斌 , 韩涛 , 杨维 , 张才俊 , 孙林檀 , 田诺 , 潘子春 , 李葵 , 李明 , 张引强 , 黄影
CPC分类号: G06F17/277 , G06F17/2785
摘要: 本发明公开了一种基于CNN‑RSC组合优化算法的语音情感分析方法,属于情感技术领域,具体步骤包括:对训练集的语料进行分词处理得到词语;对词语进行向量编码;生成词向量;将生成的词向量作为输入样本,输入到卷积神经网络模型中;卷积层过滤输入样本的词向量中多个词之间的局部特征,生成新的特征向量;池化层捕获新特征向量最大值,得到特征词向量矩阵;特征词向量矩阵作为递归自编码中的特征输入,得到最佳向量;最佳向量加入到输出层进行分类,输出情感分类结果;对情感分类结果进行误差分析和优化处理。本发明提出的组合优化算法在对文本情感特征的自动学习上有着不错的效果,模型的训练速度也大大的提高,分类结果准确度高、自动学习能力强。
-
公开(公告)号:CN108831435A
公开(公告)日:2018-11-16
申请号:CN201810576165.1
申请日:2018-06-06
申请人: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
发明人: 赵永生 , 吴立刚 , 徐海青 , 陈是同 , 徐唯耀 , 秦浩 , 王文清 , 杨维 , 张才俊 , 孙林檀 , 田诺 , 郑娟 , 秦婷 , 梁翀 , 浦正国 , 张天奇 , 余江斌 , 韩涛 , 潘子春 , 李葵 , 李明 , 张引强 , 黄影
摘要: 本发明公开了一种基于多情感说话人自适应的情感语音合成方法,属于语音合成技术领域,包括:对多说话人情感语音数据模型进行说话人自适应训练,获得多说话人情感语音数据的平均音模型;对平均音模型进行说话人自适应变换,得到说话人相关的自适应模型;得到目标文本的上下文相关的标注文件,并生成相应的语音参数;将语音参数合成得到目标说话人目标情感的语音。本发明示例的语音合成方法,可以减小语音库中说话人的差异所造成的影响,提高合成语音的情感相似度,只用少量的待合成的情感语料,就能够合成出自然度、流利度、情感相似度都很好的情感语音。
-
公开(公告)号:CN208814425U
公开(公告)日:2019-05-03
申请号:CN201821187493.4
申请日:2018-07-24
申请人: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
发明人: 赵峰 , 徐海青 , 吴立刚 , 章爱武 , 潘子春 , 李葵 , 李明 , 周明 , 张引强 , 黄影 , 陈是同 , 徐唯耀 , 秦浩 , 王文清 , 郑娟 , 王维佳 , 秦婷 , 梁翀 , 浦正国 , 张天奇 , 余江斌 , 韩涛 , 杨维 , 张才俊 , 林胜
IPC分类号: B65H75/44
摘要: 本实用新型公开了一种用于便携式语音识别装置的绕线装置,包括连接块,连接块的内部设有截面为圆形的容纳空腔,容纳空腔内转动连接有一根卷轴,容纳空腔的一侧设有开口,所述开口与外界相通,卷轴远离容纳空腔封堵的一端设有转盘,连接块在靠近转盘的一侧设有与转盘契合的第二凹槽。本实用新型在不使用时能够将数据线缠绕收卷起来,避免了数据线杂乱无序的现象,保证了数据线的整洁度,而且在使用时能够及时的展开,提高语音输入的及时性。
-
公开(公告)号:CN208814424U
公开(公告)日:2019-05-03
申请号:CN201821173228.0
申请日:2018-07-24
申请人: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
发明人: 赵永生 , 徐海青 , 吴立刚 , 陈是同 , 徐唯耀 , 秦浩 , 潘子春 , 李葵 , 李明 , 周明 , 张引强 , 黄影 , 杨维 , 张才俊 , 孙林檀 , 田诺 , 王文清 , 郑娟 , 浦正国 , 秦婷 , 梁翀 , 张天奇 , 余江斌 , 韩涛 , 王维佳 , 林胜 , 孔伟伟
IPC分类号: B65H75/44
摘要: 本实用新型公开了一种具备绕线组件的语音识别装置,包括壳体以及设于壳体内的语音识别模块,所述壳体的顶部设有语音输入的插接口,插接口用于插入语音输入的数据线,所述插接口与语音识别模块连接,壳体的底部连接有绕线组件,绕线组件包括连接块,连接块的内部设有截面为圆形的容纳空腔,容纳空腔内转动连接有一根卷轴,容纳空腔的一侧设有开口,所述开口与外界相通,卷轴远离容纳空腔封堵的一端设有转盘,连接块在靠近转盘的一侧设有与转盘契合的第二凹槽。本实用新型在不使用时能够将数据线缠绕收卷起来,避免了数据线杂乱无序的现象,保证了数据线的整洁度,而且在使用时能够及时的展开,提高语音输入的及时性。
-
公开(公告)号:CN208813125U
公开(公告)日:2019-05-03
申请号:CN201821172721.0
申请日:2018-07-24
申请人: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司信息通信分公司 , 国家电网有限公司
发明人: 吴立刚 , 徐海青 , 陈是同 , 徐唯耀 , 秦浩 , 潘子春 , 李葵 , 李明 , 周明 , 张引强 , 黄影 , 王文清 , 郑娟 , 浦正国 , 秦婷 , 梁翀 , 张天奇 , 余江斌 , 韩涛 , 王维佳 , 林胜 , 孔伟伟 , 杨维 , 张才俊 , 孙林檀 , 田诺
摘要: 本实用新型公开了一种新型车载式语音识别装置,包括显示面板、语音识别模块以及语音输入装置,语音输入装置与语音识别模块连接,语音识别模块与控制系统连接,控制系统通过显示面板显示出操作界面,语音输入装置包括安装在车辆驾驶室面板上的固定板以及安装在固定板中心处的导音筒,导音筒在位于靠近固定板的一端设有声音收集板,导音筒远离固定板的一端安装有麦克风,导音筒的通体内壁从声音收集板向麦克风的方向呈三层的阶梯状,且阶梯的直径依次增大,麦克风靠近声音收集板的一端设有硅胶套,硅胶套的中心设有第一通孔,麦克风套在第一通孔内,本实用新型能够有效的降低噪音对麦克风的影响,提高了车载语音识别的精度。
-
-
-
-
-
-
-
-
-