-
公开(公告)号:CN111916074A
公开(公告)日:2020-11-10
申请号:CN202010601540.0
申请日:2020-06-29
申请人: 厦门快商通科技股份有限公司
摘要: 本发明提出了一种跨设备语音控制方法、系统、终端及存储介质,所述方法包括:采集多人在不同设备上的训练语音数据,构建训练数据集;对训练语音数据进行预处理,提取出训练语音数据的MFCC特征以训练生成语音映射模型;获取从第一设备采集的注册语音数据,提取出注册语音数据的MFCC特征,进行音频指纹注册,绑定用户ID;获取从第二设备采集的操作指令语音数据,提取出操作指令语音数据的MFCC特征,并输入到语音映射模型中,映射到通过第一设备注册的音频指纹,识别出对应的用户ID;根据操作指令语音数据,完成对用户ID对应的第一设备相应的语音控制;实现了跨设备间的语音控制和权限用户语音验证,提高了跨设备语音识别的准确率。
-
公开(公告)号:CN111785292A
公开(公告)日:2020-10-16
申请号:CN202010426246.0
申请日:2020-05-19
申请人: 厦门快商通科技股份有限公司
摘要: 本发明公开了一种基于图像识别的语音混响强度估计方法、装置及存储介质,其通过将混响语音转换为三维语谱图;通过对所述三维语谱图进行图像检测,得到所述混响语音在所述三维语谱图中的拖尾段;计算所述拖尾段的能量强度,并以该能量强度作为混响强度的初始估计值;最后对两个以上拖尾段的初始估计值之间进行平滑处理,得到最终估计值,并将该最终估计值作为所述混响语音的混响强度的度量,从而能够极大的提高混响强度度量的抗干扰性和准确性。
-
公开(公告)号:CN111696524A
公开(公告)日:2020-09-22
申请号:CN202010315390.7
申请日:2020-04-21
申请人: 厦门快商通科技股份有限公司
摘要: 本发明公开了一种叠字语音识别方法,包括以下步骤:获取待识别语音;提取待识别语音的语音特征,语音特征包括能量衰减特征;将语音特征输入已经训练好的神经网络模型中;神经网络模型判断是否有叠字出现。本发明还公开了一种采用上述方法的叠字语音识别系统。本发明加入了能量衰减特征进行识别,提高叠字的识别率。
-
公开(公告)号:CN107704869B
公开(公告)日:2020-09-18
申请号:CN201710778236.1
申请日:2017-09-01
申请人: 厦门快商通科技股份有限公司
摘要: 本发明涉及计算机技术领域,提供了一种语料数据抽样方法,其特征在于,所述方法包含步骤:确定语料数据分类规则;基于所述分类规则,建立规则模型;基于所述规则模型对原始语料库中的语料数据进行分类;计算所述分类结果的准确率;根据所述准确率、目标抽样数据量确定实际抽样数量;根据所述实际抽样数量,从分类后的所述语料数据中抽取语料数据。通过语料数据抽样方法,可预先对原始语料库中的语料数据进行分类处理,并通过准确率的计算,来修正分类结果,从而使得实际的抽样数据量更贴近模型训练需求,在一定程度降低了由于语料数据类型偏差而引起的模型训练效果不佳的概率。此外,还提供一种模型训练方法。
-
公开(公告)号:CN106570708B
公开(公告)日:2020-09-11
申请号:CN201610927667.5
申请日:2016-10-31
申请人: 厦门快商通科技股份有限公司
IPC分类号: G06Q30/00 , G06F16/332 , G06F16/35
摘要: 本发明公开了一种智能客服知识库的管理方法及系统,通过利用主题模型对各个对话记录进行对话主题的分类,得到不同主题类别的对话组;利用文本深度表示模型计算得到每一个问题的向量值及每一个答案的向量值;并根据所述向量值对所述对话组的每一个问题进行分组,得到问题组;以及对所述问题组进行向量平均值的计算,得到每个问题组的向量平均值;根据所述向量值和所述向量平均值进行分组管理,极大的提高了知识库的管理效率,并加快了客服回答问题的响应速度,提高了客服推荐答案的准确率,用户体验更好。
-
公开(公告)号:CN111601310A
公开(公告)日:2020-08-28
申请号:CN202010257507.0
申请日:2020-04-03
申请人: 厦门快商通科技股份有限公司
摘要: 本发明提供了一种基于声纹识别的通话加密方法、系统及移动终端,该方法包括:当用户设备与任意通讯设备之间建立通讯时,获取通讯设备对象用户的通话语音进行声纹提取,得到声纹特征,判断声纹特征是否满足通话加密条件;若是,对用户设备与通讯设备之间通话进行录音,得到语音录音;获取声纹特征的加密标识,根据加密标识对用户设备与通讯设备之间的通话模式进行切换;当判断到通讯结束时,获取语音录音,根据加密标识对语音录音进行加密存储。本发明通过判断声纹特征是否满足通话加密条件,以判定当前用户设备与通讯设备之间的通讯是否进行加密,进而能针对公用电话、网络电话或未存储的电话号码进行通话加密判断,提高了通话加密的准确性。
-
公开(公告)号:CN111583946A
公开(公告)日:2020-08-25
申请号:CN202010360697.9
申请日:2020-04-30
申请人: 厦门快商通科技股份有限公司
IPC分类号: G10L21/02 , G10L21/0208 , G10L15/26
摘要: 本发明公开了一种语音信号增强方法和装置以及设备。其中,所述方法包括:获取语音信号和对应该语音信号的地理位置信息,和根据该地理位置信息,对该语音信号对应的语音现场匹配环境场景类型,和根据该环境场景类型,消除该语音信号中的环境噪声,和从该消除环境噪声后的语音信号中识别出所需的语音数据,以及增强该识别出的语音数据。通过上述方式,能够实现降低语音信号中包含的环境噪声的干扰,提高从语音信号进行语音识别的准确率,进而能够提高对该识别出的语音进行语音增强的效果。
-
公开(公告)号:CN111581426A
公开(公告)日:2020-08-25
申请号:CN202010364799.8
申请日:2020-04-30
申请人: 厦门快商通科技股份有限公司
IPC分类号: G06F16/632 , G06F16/683 , G06K9/62 , G10L25/54
摘要: 本发明公开了一种音频指纹匹配方法和装置以及设备。其中,所述方法包括:确定一个或多个关联用户档案数据中的个人特征的共性特征,和构建关联该一个或多个共性特征的音频指纹数据库集合,和按照该共性特征的数量,对该音频指纹数据库集合中的所有音频指纹数据库进行优先级排序,和从该经优先级排序后的该音频指纹数据库集合中的所有音频指纹数据库配置到与待匹配的音频指纹所对应的用户的个人特征的共性特征的音频指纹数据库,以及将该待匹配的音频指纹与该配置到的音频指纹数据库进行相似度匹配,匹配出相似度最高的音频指纹所对应的用户,为该待匹配的音频指纹所对应的用户。通过上述方式,能够实现提高音频指纹匹配的效率。
-
公开(公告)号:CN111460209A
公开(公告)日:2020-07-28
申请号:CN202010293618.7
申请日:2020-04-15
申请人: 厦门快商通科技股份有限公司
IPC分类号: G06F16/635 , G06F16/68 , G06F16/61 , G10L15/26
摘要: 本发明公开了一种音频指纹的检索方法和装置以及设备。其中,所述方法包括:获取输入到音频指纹平台的检索引擎中的音频信息,和提取该音频信息的音频特征,和在该音频指纹平台检索匹配该音频特征的多个音频指纹的音频指纹检索结果,以及按关联度排序展示该多个音频指纹的音频指纹检索结果。通过上述方式,能够实现检索得到与输入到音频指纹平台的检索引擎中的音频信息对应的音频特征相关联的多个音频指纹的音频指纹检索结果。
-
公开(公告)号:CN111444376A
公开(公告)日:2020-07-24
申请号:CN202010293633.1
申请日:2020-04-15
申请人: 厦门快商通科技股份有限公司
摘要: 本发明公开了一种音频指纹的识别方法和装置以及设备。其中,所述方法包括:采集至少一个用户的音频数据和个人特征,和根据该每个用户的个人特征,对该每个用户的音频数据进行音频指纹提取,和根据该个人特征和该音频指纹,构建关联该个人特征的至少一个共性特征的音频指纹数据库,以及根据待识别的音频指纹和对应该待识别的音频指纹的个人特征,从关联对应该待识别的音频指纹的个人特征的至少一个共性特征的音频指纹数据库中识别出与该待识别的音频指纹相似度最高的音频指纹对应的用户,其中,该待识别的音频指纹对应的用户为该构建的音频指纹数据库中的用户。通过上述方式,能够实现提高音频指纹的识别效率。
-
-
-
-
-
-
-
-
-