-
公开(公告)号:CN111541645A
公开(公告)日:2020-08-14
申请号:CN202010213474.X
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: H04L29/06 , H04L29/12 , H04M7/00 , G06F16/2455 , G06F16/2458 , G06F16/248 , G06N5/02
Abstract: 本发明公开了一种VoIP服务知识库构建方法及系统。本方法为:1)在各选定的物理网关上分别部署一实时流量解析模块,用于从VoIP流量中解析出SIP协议和SDP协议,生成VoIP信令日志发送至消息队列;2)从各消息队列中实时读取VoIP信令日志并对其统一标准化;3)对标准化日志进行实时统计计算,并将统计计算结果实时存入实时结果数据库;4)定期从原始日志数据库中获取标准化日志进行聚合,得到各服务域名下的统计信息;然后基于服务域名下的统计信息和设定的判断条件判断该服务域名所代表的VoIP服务的网关类型、VoIP服务与PSTN的关系以及VoIP服务是否存在可疑行为,并将其保存在VoIP服务基础知识库。
-
公开(公告)号:CN115915038A
公开(公告)日:2023-04-04
申请号:CN202110805859.X
申请日:2021-07-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于移动用户信令数据的跨城通勤用户识别方法及装置,包括:基于每一周期的白天时间段与夜间时间段,利用目标区域的移动用户信令数据获取该周期日工作用户与该周期日居住用户;依据该周期日工作用户的该周期夜间信令数据与该周期日居住用户的该周期白天信令数据,分别得到该周期夜间信令消失用户与该周期白天信令消失用户;利用全部移动用户在设定时间段内成为该周期夜间信令消失用户或该周期白天信令消失用户的次数,得到跨城通勤用户识别结果。本发明基于原始信令数据挖掘跨城通勤用户,采用Spark计算框架进行分析处理,具有高可靠性和高效率,可用于区域人口监管。
-
公开(公告)号:CN115700514A
公开(公告)日:2023-02-07
申请号:CN202110806905.8
申请日:2021-07-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/332 , G06F40/30 , G06F18/2411
Abstract: 本发明公开了一种结合BIGRU和多头注意的事件主体提取方法及装置,包括:把文本数据转化为文本输入序列X;利用BiGRU网络获取文本输入序列X对应的向量XB;基于文本输入序列X与向量XB进行多头注意力计算;依据注意力计算结果,获取事件主体提取结果。本发明使用BIGRU网络学习上下文语义特征,通过引入多头注意力机制捕获序列中的关键特征信息,提高了工作效率及准确性。
-
公开(公告)号:CN111541645B
公开(公告)日:2022-06-17
申请号:CN202010213474.X
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: H04L61/4511 , H04L65/1101 , H04M7/00 , G06F16/2455 , G06F16/2458 , G06F16/248 , G06N5/02
Abstract: 本发明公开了一种VoIP服务知识库构建方法及系统。本方法为:1)在各选定的物理网关上分别部署一实时流量解析模块,用于从VoIP流量中解析出SIP协议和SDP协议,生成VoIP信令日志发送至消息队列;2)从各消息队列中实时读取VoIP信令日志并对其统一标准化;3)对标准化日志进行实时统计计算,并将统计计算结果实时存入实时结果数据库;4)定期从原始日志数据库中获取标准化日志进行聚合,得到各服务域名下的统计信息;然后基于服务域名下的统计信息和设定的判断条件判断该服务域名所代表的VoIP服务的网关类型、VoIP服务与PSTN的关系以及VoIP服务是否存在可疑行为,并将其保存在VoIP服务基础知识库。
-
公开(公告)号:CN111785253A
公开(公告)日:2020-10-16
申请号:CN202010554156.X
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种分布不均衡的语种识别方法及系统,该方法包括如下步骤:步骤SS1:训练步骤,具体包括:对各语种的语音数据进行BN特征提取,生成的特征参数输入语种识别系统生成语种识别模型;步骤SS2:识别步骤,具体包括:加载步骤SS1获得的语种识别模型,对待识别的语音做判别,输出识别结果。通过本发明,使语种识别可以在分布不均衡的数据环境下同样产生有效作用,解决现有通用技术下的语种识别问题。
-
公开(公告)号:CN110942783A
公开(公告)日:2020-03-31
申请号:CN201910978660.X
申请日:2019-10-15
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明涉及一种基于音频多级聚类的群呼型骚扰电话分类方法,该方法包括:S100,将包括有多个音频数据的音频池划分为多个等同分组,将每个分组依次进行特征提取及特征对比,进而执行聚类分析,得到音频聚类;S200,将音频进行语音转写,将语音转写的文本进行关键词库检索对比,得到关键词对比结果;S300,将音频聚类执行音频库检索对比,得到音频聚类结果;S400,对所述关键词对比结果及音频聚类结果进行合并分析,得到自动分类的群呼型骚扰电话。本发明的有益效果为:能够有效检测和发现群呼型骚扰电话;结合关键词、文本转写等手段,对骚扰电话实现了自动分类,节省了人工成本,提高了效率。
-
公开(公告)号:CN110602332A
公开(公告)日:2019-12-20
申请号:CN201910708779.5
申请日:2019-08-01
Applicant: 国家计算机网络与信息安全管理中心 , 北京邮电大学
Abstract: 本发明公开了一种通信线路特征提取方法、通信线路识别方法及装置。所述通信线路特征提取方法包括:获取主叫端与被叫端之间的通话音频;对所述通话音频进行处理,以去除所述通话音频中的人声音频;分别采用差分方法、频率划分方法和自编码网络方法从处理后的通话音频中对应提取第一噪声特征、第二噪声特征和第三噪声特征,并将所述第一噪声特征、所述第二噪声特征和所述第三噪声特征作为所述主叫端与所述被叫端之间的通信线路特征,从而能够准确且高效的提取通信线路特征,进而提高通信线路识别的准确性和高效性,提高电话通信的可靠性。
-
公开(公告)号:CN110942783B
公开(公告)日:2022-06-17
申请号:CN201910978660.X
申请日:2019-10-15
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明涉及一种基于音频多级聚类的群呼型骚扰电话分类方法,该方法包括:S100,将包括有多个音频数据的音频池划分为多个等同分组,将每个分组依次进行特征提取及特征对比,进而执行聚类分析,得到音频聚类;S200,将音频进行语音转写,将语音转写的文本进行关键词库检索对比,得到关键词对比结果;S300,将音频聚类执行音频库检索对比,得到音频聚类结果;S400,对所述关键词对比结果及音频聚类结果进行合并分析,得到自动分类的群呼型骚扰电话。本发明的有益效果为:能够有效检测和发现群呼型骚扰电话;结合关键词、文本转写等手段,对骚扰电话实现了自动分类,节省了人工成本,提高了效率。
-
公开(公告)号:CN113742478A
公开(公告)日:2021-12-03
申请号:CN202010474192.5
申请日:2020-05-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/33 , G06F40/295 , G06N3/04
Abstract: 本发明公开了一种针对海量文本数据的定向筛选架构及方法。本方法步骤包括:1)使用关键词匹配方法从待筛选文本中获取疑似目标文本;2)从已标注的目标文本中提取常用句式,并分为与业务强相关句式、与业务弱相关句式;对待筛选文本进行模糊句式匹配,如果与业务强相关句式匹配,则将文本判断为目标文本,否则为疑似目标文本;3)对每一疑似目标文本进行分类;4)根据疑似目标文本匹配上的关键词的个数确定文本的评估值E1;根据分类判别结果,确定文本的评估值E2;基于文本与外部辅助语料的信息匹配结果确定文本的评估值E3;然后基于评估值E1~E3,计算得到文本最终评分反馈给研判层;5)研判层确定反馈的文本是否为目标文本。
-
公开(公告)号:CN109920406B
公开(公告)日:2021-12-03
申请号:CN201910245435.5
申请日:2019-03-28
Applicant: 国家计算机网络与信息安全管理中心 , 珠海高凌信息科技股份有限公司
Abstract: 本发明的技术方案包括一种基于可变起始位置的动态语音识别方法及系统,用于实现:实时加载输入的语音流信号,对语音信号进行预处理;对语音信号进行特征提取,获取语音信号中的特征;根据语音信号中的特征调用语音模型信息库的多个模型对语音信号进行逐帧模式匹配。本发明的有益效果为:本发明的有益效果为容易理解,实现简单,当前语音模型匹配选取长度较为合理,经过算法改进后,减少了语音模型匹配次数,语音识别效率比之前的算法提高了30%的效率。
-
-
-
-
-
-
-
-
-