-
公开(公告)号:CN111091809B
公开(公告)日:2023-05-23
申请号:CN201911051663.5
申请日:2019-10-31
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G10L15/00 , G10L15/02 , G10L15/08 , G06F18/2411 , G06F18/214 , G06F18/25
Abstract: 本发明提供一种深度特征融合的地域性口音识别方法和装置,方法包括:提取待识别语音的瓶颈BN特征和滑动差分倒谱SDC特征;将瓶颈BN特征和滑动差分倒谱SDC特征输入预先训练后的支持向量机SVM分类器中,得到输出的待识别语音的语音类别。本发明采用多特征融合的语种识别系统,提取语音的深度特征,融合传统的SDC特征,输入SVM分类器,实现更鲁棒的语种识别功能,取得了对地域性方言普通话较好的分类效果。
-
公开(公告)号:CN110930982A
公开(公告)日:2020-03-27
申请号:CN201911050896.3
申请日:2019-10-31
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
Abstract: 本发明提供一种多口音声学模型和多口音语音识别方法,所述多口音声学模型包括多个BLSTM层、多个Softmax输出层和一个门控单元,多个BLSTM层依次串接后与每一个Softmax输出层串接,门控单元位于所述多个BLSTM层中的其中两个相邻的BLSTM层之间。本发明对传统的普通话声学模型构造进行改进,针对需要识别的多种口音数据的类别数量,将传统的普通话声学模型中的Softmax输出层复制多份,每一个Softmax输出层为口音特定输出层,将输出层设计为口音特定的形式,即每种口音独享其对应的输出层;而门控单元对神经网络的BLSTM层的输出进行一种口音特定的调节,以使该模型更好地适用于多种口音。
-
公开(公告)号:CN111091809A
公开(公告)日:2020-05-01
申请号:CN201911051663.5
申请日:2019-10-31
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
Abstract: 本发明提供一种深度特征融合的地域性口音识别方法和装置,方法包括:提取待识别语音的瓶颈BN特征和滑动差分倒谱SDC特征;将瓶颈BN特征和滑动差分倒谱SDC特征输入预先训练后的支持向量机SVM分类器中,得到输出的待识别语音的语音类别。本发明采用多特征融合的语种识别系统,提取语音的深度特征,融合传统的SDC特征,输入SVM分类器,实现更鲁棒的语种识别功能,取得了对地域性方言普通话较好的分类效果。
-
公开(公告)号:CN115617962A
公开(公告)日:2023-01-17
申请号:CN202110806921.7
申请日:2021-07-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/9532 , G06F40/279
Abstract: 本发明提供一种网络公害文本识别方法及装置,包括:通过提取目标网络文本中的网址链接,对目标网络文本进行初步判定;若无法判定,则计算无效信息度,并生成目标网络文本的拼音列表、关键词列表、及关键词拼音列表;通过各关键词的字元素在目标网络文本中的分布及关键词拼音在目标网络文本拼音列表中的分布,计算各关键词的网络公害分;基于无效信息度对网络公害分进行修订,并根据修订结果,得到网络公害文本识别结果。本发明通过网络公害关键词字符和拼音的模糊匹配,可以准确识别出网络公害文本,同时可以有效应对目标文本中网络公害词被分割、倒序、文字竖排、谐音字等信息隐藏手段。
-
公开(公告)号:CN111354347B
公开(公告)日:2023-08-15
申请号:CN201811571564.5
申请日:2018-12-21
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L15/08
Abstract: 本发明提出了一种基于自适应热词权重的语音识别方法及系统,所述方法包括:生成热词网络并和静态解码网络一起加载到语音识别解码器中;将待识别的语音信号同步地在静态解码网络和热词网络上进行令牌传递,自适应地计算热词权重,并对静态解码网络上令牌的分数重新打分;输出解码结果。本发明的基于自适应热词权重的语音识别方法在一遍解码的过程中就能提升热词召回率,不影响解码的速度,并且自适应地计算热词权重既能有效地提高热词的召回率,不影响原先的解码速度,又能提高系统的鲁棒性。
-
公开(公告)号:CN115238703A
公开(公告)日:2022-10-25
申请号:CN202210616914.5
申请日:2022-06-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/35 , G06N20/00
Abstract: 本发明涉及一种包含历史深度语义特定文本的识别方法及系统,所述一种包含历史深度语义特定文本的识别方法包括:利用历史深度语义特定文本数据进行初始处理得到历史深度语义特定文本初始数据;利用所述历史深度语义特定文本初始数据得到历史深度语义特定文本识别结果,通过大数据分析特定文本进行模型训练,并对特定内容的语义特征进行分析筛除,进而进行分类、识别及定性,提升了对于特定文本的识别准确率,避免误差的产生。
-
公开(公告)号:CN106791220B
公开(公告)日:2021-06-04
申请号:CN201611082262.2
申请日:2016-11-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W12/128 , H04M3/436 , H04M3/22 , H04M1/57
Abstract: 本发明公开了一种防止电话诈骗的方法及系统,其中,所述方法包括:获取实时话单;提取所述实时话单的号码特征和/或行为特征;根据预设的诈骗电话识别模型对所述实时话单的号码特征和/或行为特征进行分析,以确定所述实时话单对应的通话行为是否为诈骗电话;若确认所述实时话单对应的通话行为是诈骗电话,则向所述实时话单中的被叫号码发送报警提示,并将本次诈骗电话识别结果发送到第三方管理系统。本发明能够准确定位诈骗电话,及时获知诈骗电话的发生,并及时向诈骗电话对应的被叫号码发送报警提示,有效提高了用户对骚扰、诈骗电话的防控能力。
-
公开(公告)号:CN110047509B
公开(公告)日:2021-04-02
申请号:CN201910240865.8
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种两级子空间划分方法及装置,用于实现:采用基于模型子空间的二级匹配方法,处理过程分为两个步骤:第一步通过粗筛定位子空间,确定待检音频模型空间所属范围,第二步细匹,即在子空间内部通过精度较高的传统算法命中目标模型,即包括特征提取、聚类计算、子空间划分、中心点计算四个过程。本发明的有益效果为:实现简单,耗时较小,对于数量巨大的模型特征,其实时性足以满足业务需求,可任意调整簇数的取值,能够有效的划分子空间,并且能够较为均匀的划分到不同的子空间中,同时缩小了模型匹配范围,单次语音特征比较能够有效降低模型数量,提高了效率。
-
公开(公告)号:CN106686264B
公开(公告)日:2021-03-02
申请号:CN201610965273.9
申请日:2016-11-04
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04M3/436
Abstract: 本发明属于电信中有害电话监控技术领域,尤其是涉及一种诈骗电话筛选分析方法及系统。本发明的系统利用诈骗电话分析模型对历史数据进行分析,确定模型各特征权重值;对实时数据进行分析检测,检测结果与设定阈值比较给出诈骗电话的置信度。整个系统由数据查询管理系统、实时检测系统、模型自学习系统、趋势预测系统、数据存储系统组成。数据查询管理系统提供全量话单查询、诈骗话单查询、模型参数管理、自学习管理、趋势预测分析功能。实时检测系统通过诈骗电话发现模型实时分析、检测话单数据,发现诈骗电话。模型自学习系统对历史话单数据分析,通过自学习算法不断优化模型参数。趋势预测系统提供对未来诈骗电话趋势和变化进行预测。数据存储系统采用分布式存储系统,大数据分析处理引擎为整个系统提供快速数据抓取、数据分发、数据查询功能。
-
公开(公告)号:CN111785253A
公开(公告)日:2020-10-16
申请号:CN202010554156.X
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种分布不均衡的语种识别方法及系统,该方法包括如下步骤:步骤SS1:训练步骤,具体包括:对各语种的语音数据进行BN特征提取,生成的特征参数输入语种识别系统生成语种识别模型;步骤SS2:识别步骤,具体包括:加载步骤SS1获得的语种识别模型,对待识别的语音做判别,输出识别结果。通过本发明,使语种识别可以在分布不均衡的数据环境下同样产生有效作用,解决现有通用技术下的语种识别问题。
-
-
-
-
-
-
-
-
-