一种中英文混合语音识别方法及装置

    公开(公告)号:CN110675854B

    公开(公告)日:2022-10-28

    申请号:CN201910780880.1

    申请日:2019-08-22

    摘要: 本发明公开一种中英文混合语音识别方法及装置,属于语音识别技术领域,该方法包括,获取中英文混合词典,该中英文混合词典包括:训练文本,基于“汉字‑拼音”和“拼音‑音素”的结构,对训练文本中的英文表达、中英文表达生成音素规则;将中英文混合词典作为训练词典,进行语言模型训练,得到训练后的语言模型,训练语料,对语料提取语音特征,基于语音特征采用时延神经网络进行声学模型训练,得到训练后的声学模型;结合训练后的声学模型和训练后的语言模型对中英文混合语音进行语音识别。本发明避免对每个国际音标建立一个音素,解决了语音模型庞大、解码速度慢的问题,提高了中英文混合语音的识别正确率。

    空调温度调节方法、介质、设备及装置

    公开(公告)号:CN111023470A

    公开(公告)日:2020-04-17

    申请号:CN201911240597.6

    申请日:2019-12-06

    摘要: 本发明公开了一种空调温度调节方法、介质、设备及装置,其中方法包括:获取第一音频数据,并对第一音频数据分类,以生成训练集;提取训练集中每个音频数据所对应的声学特征,并对声学特征进行组合,以生成对应的组合特征;将训练集中的每个组合特征输入到长短期记忆模型中进行音频识别模型的训练,以获取音频识别模型;获取空调用户第二音频数据,并提取第二音频数据对应的组合特征;将第二音频数据对应的组合特征输入到音频识别模型中,并根据音频识别模型的输出结果判断空调用户的年龄段,以及根据空调用户的年龄段对空调的温度进行调节;能够根据空调用户的年龄对温度进行调节,以防止特殊人群因为空调温度过低而导致身体不适,提高用户体验。

    文本识别模型相似度训练方法、系统、识别方法及终端

    公开(公告)号:CN110781277A

    公开(公告)日:2020-02-11

    申请号:CN201910901703.4

    申请日:2019-09-23

    摘要: 本发明适用于文本识别技术领域,提供了一种文本识别模型相似度训练方法、系统、识别方法及终端,该方法包括:获取样本数据,分别对样本数据内的样本语句进行相似度计算,以获取多组相似语句组合;判断相似语句组合内的相似语句之间是否满足语义条件,根据判断结果对相似语句进行样本标记;根据样本标记的标记结果以构建训练数据集,根据训练数据集对文本识别模型进行模型训练。本发明通过对相似语句组合内的相似语句进行是否满足语义条件的判断的设计,以对应进行正样本标记或负样本标记,以达到将训练数据集中组词相同但语义不同的相似语句进行负标记的效果,进而防止了后续文本识别模型由于该组词相同但语义不同的相似语句所导致的答非所问。

    语音抓包解析方法、系统、移动终端及存储介质

    公开(公告)号:CN110730274A

    公开(公告)日:2020-01-24

    申请号:CN201910986279.8

    申请日:2019-10-17

    摘要: 本发明适用于声纹识别技术领域,提供了一种语音抓包解析方法、系统、移动终端及存储介质,该方法包括:对交换机上的通信端口进行端口镜像,当所述交换机上接收到语音数据时,对所述语音数据进行镜像抓包;对抓包到的所述语音数据进行解析,并对解析后的语音数据进行解码,以得到语音文件;对所述语音文件进行声纹识别,根据声纹识别结果获取用户信息,并将所述用户信息发送至所述通信端口。本发明通过对通信端口进行端口镜像的设计,使得该通信端口在进行通话过程中,能实时的抓取到通话语音,并通过对该通话语音进行解析、解码和声纹识别的设计,以使能及时获取到该通话语音中用户的信息,方便了工作人员进行对后续对话的选择性。

    一种中英文混合语音识别方法及装置

    公开(公告)号:CN110675854A

    公开(公告)日:2020-01-10

    申请号:CN201910780880.1

    申请日:2019-08-22

    摘要: 本发明公开一种中英文混合语音识别方法及装置,属于语音识别技术领域,该方法包括,获取中英文混合词典,该中英文混合词典包括:训练文本,基于“汉字-拼音”和“拼音-音素”的结构,对训练文本中的英文表达、中英文表达生成音素规则;将中英文混合词典作为训练词典,进行语言模型训练,得到训练后的语言模型,训练语料,对语料提取语音特征,基于语音特征采用时延神经网络进行声学模型训练,得到训练后的声学模型;结合训练后的声学模型和训练后的语言模型对中英文混合语音进行语音识别。本发明避免对每个国际音标建立一个音素,解决了语音模型庞大、解码速度慢的问题,提高了中英文混合语音的识别正确率。

    垃圾分类回收装置及垃圾分类回收监控系统

    公开(公告)号:CN110615209A

    公开(公告)日:2019-12-27

    申请号:CN201910766243.9

    申请日:2019-08-19

    IPC分类号: B65F1/14 B65F1/00

    摘要: 本申请提供了一种垃圾分类回收装置及垃圾分类回收监控系统,装置包括:箱体、转动盖、控制机构、生物特征采集部件和物品特征采集部件。箱体设置有开口,转动盖在垃圾箱关闭时遮挡所述开口,控制机构分别连接生物特征采集部件、物品特征采集部件和转动盖。生物特征采集部件用于采集用户的生物特征,并将生物特征发送至控制机构,物品特征采集部件用于采集由开口进入箱体内的物品的特征数据,并将特征数据发送至控制机构,控制机构则根据用户的生物特征和物品的特征数据进行垃圾分类回收和计算用户垃圾分类准确率,与现有技术中相比,通过计算垃圾分类准确率以提醒用户准确分类垃圾,可以有效推动用户准确分类垃圾的意识。

    语音识别模型分词训练方法、系统、移动终端及存储介质

    公开(公告)号:CN110853625A

    公开(公告)日:2020-02-28

    申请号:CN201910878880.5

    申请日:2019-09-18

    IPC分类号: G10L15/06

    摘要: 本发明适用于语音识别技术领域,提供了一种语音识别模型分词训练方法、系统、移动终端及存储介质,该方法包括:收集本地存储的文本语料,设置组词总数,计算每个当前文字与下一文字之间的组合频数;当判断到组合频数大于第一频数阈值时,将当前文字与下一文字进行组词并标记为一个整体,直至最长组合频数小于等于第二频数阈值,停止组词,以得到组词词典;将组词词典与原始词典进行合并,并根据合并后的词典对文本语料进行分词,以得到分词语料;根据分词语料对语音识别模型进行训练。本发明通过构造组词词典对原始词典进行扩充,使得不需要额外收集用于子串标注学习的训练语料,也不需要事先进行人工分词或者采用其他分词算法进行分词。

    标点符号添加方法、系统、移动终端及存储介质

    公开(公告)号:CN110826301A

    公开(公告)日:2020-02-21

    申请号:CN201910888380.X

    申请日:2019-09-19

    摘要: 本发明适用于语音识别技术领域,提供了一种标点符号添加方法、系统、移动终端及存储介质,该方法包括:获取待识别语音进行语音识别,以得到目标文本;对目标文本进行特征词的提取和标注,并将特征词的标注结果与语言表达习惯进行匹配;当标注结果与语言表达习惯匹配成功时,对提取后的目标文本进行修正条件的判断,根据判断结果对目标文本进行标点符号修正,并输出目标文本;当标注结果与语言表达习惯未匹配成功时,根据语言表达习惯对目标文本进行标点符号添加,并输出目标文本。本发明通过基于停顿检测、特征词的标注结果和语言表达习惯,以对应对文本进行标点符号的辅助修正,防止了由于仅根据3-gram方式进行标点添加所导致的准确率低下的现象。