-
公开(公告)号:CN111341319B
公开(公告)日:2023-05-16
申请号:CN201811559040.4
申请日:2018-12-19
申请人: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G10L17/02 , G10L17/04 , G10L17/18 , G10L25/18 , G10L25/30 , G10L25/45 , G10L25/51 , G06N3/08
摘要: 本发明公开了一种基于局部纹理特征的音频场景识别方法,所述方法包括:将待识别的音频信号进行预处理后逐帧提取Mel‑fbank特征和描述局部纹理的LTP特征;进行融合后输入预先训练得到的时延深度神经网络模型;得到对应于不同音频场景类型的后验概率;采用后处理决策机制处理后验概率获取待识别音频信号对应的音频场景标签。本发明的音频场景识别方法,基于对场景时频信息的有效表征,更好地实现了音频场景种类的识别。
-
公开(公告)号:CN110119648A
公开(公告)日:2019-08-13
申请号:CN201810111564.0
申请日:2018-02-05
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
摘要: 本发明公开了一种基于光学字符识别的传真图像分类方法,所述方法包括:步骤1)对扫描得到的传真图像进行噪声消除;步骤2)对噪声消除后的传真图像进行二值化处理;步骤3)对步骤2)得到的二值化图像进行仿射变换校准文本;步骤4)利用OCR方法对步骤3)处理后的传真图像进行识别,得到编码为UTF-8的输出字符串和转写置信度;步骤5)对字符串进行关键词正则匹配,得到传真图像的分类。本发明的方法利用频谱噪声消除和灰度图像二值化的预处理,在满足实时性要求的前提下提升了电子扫描得到的传真图像的质量;使传真图像能够使用基于OCR的分类方法,由此实现了传真图像的自动化分类。
-
公开(公告)号:CN113420111B
公开(公告)日:2023-08-11
申请号:CN202110674586.X
申请日:2021-06-17
申请人: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/33 , G06F16/332 , G06F40/126 , G06F40/289 , G06F40/30 , G06F18/24 , G06N3/02
摘要: 本申请实施例公开了一种用于多跳推理问题的智能问答方法及装置,方法包括:获取问题文本;对问题文本进行语义编码,获得问题文本的语义编码表示;根据问题文本的语义编码表示,确定第一预测结果,第一预测结果为问题文本的至少一个问题主体所在位置的预测结果;根据问题文本的语义编码表示,确定第二预测结果,第二预测结果为问题文本的至少一个问题关系的预测结果;根据第一预测结果和第二预测结果,生成子问题文本,子问题文本包括至少一个子问题;根据筛选文档,对至少一个子问题依次进行回答,获得与至少一个子问题对应的答案,筛选文档包括至少一个子问题对应的答案;根据至少一个子问题对应的答案,确定问题文本的最终答案。
-
公开(公告)号:CN111354347B
公开(公告)日:2023-08-15
申请号:CN201811571564.5
申请日:2018-12-21
申请人: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G10L15/08
摘要: 本发明提出了一种基于自适应热词权重的语音识别方法及系统,所述方法包括:生成热词网络并和静态解码网络一起加载到语音识别解码器中;将待识别的语音信号同步地在静态解码网络和热词网络上进行令牌传递,自适应地计算热词权重,并对静态解码网络上令牌的分数重新打分;输出解码结果。本发明的基于自适应热词权重的语音识别方法在一遍解码的过程中就能提升热词召回率,不影响解码的速度,并且自适应地计算热词权重既能有效地提高热词的召回率,不影响原先的解码速度,又能提高系统的鲁棒性。
-
公开(公告)号:CN113420111A
公开(公告)日:2021-09-21
申请号:CN202110674586.X
申请日:2021-06-17
申请人: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/33 , G06F16/332 , G06F40/126 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/02
摘要: 本申请实施例公开了一种用于多跳推理问题的智能问答方法及装置,方法包括:获取问题文本;对问题文本进行语义编码,获得问题文本的语义编码表示;根据问题文本的语义编码表示,确定第一预测结果,第一预测结果为问题文本的至少一个问题主体所在位置的预测结果;根据问题文本的语义编码表示,确定第二预测结果,第二预测结果为问题文本的至少一个问题关系的预测结果;根据第一预测结果和第二预测结果,生成子问题文本,子问题文本包括至少一个子问题;根据筛选文档,对至少一个子问题依次进行回答,获得与至少一个子问题对应的答案,筛选文档包括至少一个子问题对应的答案;根据至少一个子问题对应的答案,确定问题文本的最终答案。
-
公开(公告)号:CN112712096A
公开(公告)日:2021-04-27
申请号:CN201911022350.7
申请日:2019-10-25
申请人: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明公开了基于深度递归非负矩阵分解的音频场景分类方法及系统,该方法包括:将待分类的音频信号按照贝叶斯信息准则进行音频场景切分;将切分后的每一段音频划分为多个块,每个块包括多个音频帧;以块为单位分别输入多个预先训练好的深度递归NMF网络,得到每块音频在不同子空间中的展开特征;将不同子空间中的展开特征拼接为一个长特征向量,输入支持向量机,获得每块音频的类别判别结果;计算该段音频所有块的类别判别结果的均值,由此得到该段音频的所属类别。本发明的方法将深度NMF用于音频场景分类,通过探索相邻帧之间NMF系数的递归关系,降低模型复杂度,提高泛化能力。
-
公开(公告)号:CN111354347A
公开(公告)日:2020-06-30
申请号:CN201811571564.5
申请日:2018-12-21
申请人: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G10L15/08
摘要: 本发明提出了一种基于自适应热词权重的语音识别方法及系统,所述方法包括:生成热词网络并和静态解码网络一起加载到语音识别解码器中;将待识别的语音信号同步地在静态解码网络和热词网络上进行令牌传递,自适应地计算热词权重,并对静态解码网络上令牌的分数重新打分;输出解码结果。本发明的基于自适应热词权重的语音识别方法在一遍解码的过程中就能提升热词召回率,不影响解码的速度,并且自适应地计算热词权重既能有效地提高热词的召回率,不影响原先的解码速度,又能提高系统的鲁棒性。
-
公开(公告)号:CN111341319A
公开(公告)日:2020-06-26
申请号:CN201811559040.4
申请日:2018-12-19
申请人: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G10L17/02 , G10L17/04 , G10L17/18 , G10L25/18 , G10L25/30 , G10L25/45 , G10L25/51 , G06N3/08
摘要: 本发明公开了一种基于局部纹理特征的音频场景识别方法,所述方法包括:将待识别的音频信号进行预处理后逐帧提取Mel-fbank特征和描述局部纹理的LTP特征;进行融合后输入预先训练得到的时延深度神经网络模型;得到对应于不同音频场景类型的后验概率;采用后处理决策机制处理后验概率获取待识别音频信号对应的音频场景标签。本发明的音频场景识别方法,基于对场景时频信息的有效表征,更好地实现了音频场景种类的识别。
-
公开(公告)号:CN113676604B
公开(公告)日:2023-03-31
申请号:CN202010403400.2
申请日:2020-05-13
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 国家计算机网络与信息安全管理中心
IPC分类号: H04M7/00
摘要: 本发明实施例公开了一种语音处理方法、相关设备和存储介质。所述方法包括:第一网络设备接收到呼叫请求消息,所述呼叫请求消息中包括主叫号码和被叫号码;判断所述主叫号码是否满足预设触发条件;在判定所述主叫号码满足预设触发条件的情况下,将所述呼叫请求消息转发至接入能力网元;所述接入能力网元用于从业务服务器获得针对所述呼叫请求消息的呼叫控制策略、并根据所述呼叫控制策略对所述呼叫请求消息对应的呼叫事件进行处理。
-
公开(公告)号:CN113286035B
公开(公告)日:2022-12-30
申请号:CN202110529065.5
申请日:2021-05-14
申请人: 国家计算机网络与信息安全管理中心 , 恒安嘉新(北京)科技股份公司
发明人: 刘发强 , 张震 , 石瑾 , 李鹏 , 刁则鸣 , 黄远 , 仇艺 , 张梦影 , 袁堂岭 , 尚程 , 阿曼太 , 梁彧 , 蔡琳 , 杨满智 , 王杰 , 田野 , 金红 , 陈晓光 , 傅强
摘要: 本发明实施例公开了一种异常呼叫检测方法、装置、设备及介质。该方法包括:获取多种类型的通话记录描述数据;根据各通话记录描述数据形成至少一个多源数据分组,多源数据分组中包括至少两种类型的通话记录描述数据;将每个多源数据分组中包括的各通话记录描述数据进行关联分析,形成与每个多源数据分组分别对应的异常呼叫检测结果。在上述技术方案中,通过对多种类型的通话记录描述数据进行关联分析,得到异常呼叫检测结果,实现了有效地对异常呼叫进行安全监管,提高了异常呼叫的检测精确度。
-
-
-
-
-
-
-
-
-