-
公开(公告)号:CN112148872B
公开(公告)日:2024-04-02
申请号:CN202011043378.1
申请日:2020-09-28
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 恒安嘉新(北京)科技股份公司
IPC: G06F16/34 , G06F16/332 , G06F16/33 , G06F40/289 , G06F18/22
Abstract: 本公开实施例公开了一种自然对话主题分析方法、装置、电子设备、及存储介质,方法包括:获取多个自然对话文本,对任一自然对话文本进行切和分词处理得到分词序列;将根据所述多个自然对话文本得到的分词序列集合进行聚合分组分成多个分词序列子集合;对任一分词序列子集合提取核心关键词;对任一分词序列子集合中任一分词序列,分别计算任意两个核心关键词词序字符串的莱文斯坦距离以获取主题纯度;根据所述分词序列集合所包含的各分词序列子集合的主题纯度和对应的关键词集合,进行分析结果输出。本实施例的技术方案能够直接根据批量或海量的自然对话分析主题,无需人工参与,能提高主题分析效率。
-
公开(公告)号:CN113286035B
公开(公告)日:2022-12-30
申请号:CN202110529065.5
申请日:2021-05-14
Applicant: 国家计算机网络与信息安全管理中心 , 恒安嘉新(北京)科技股份公司
Inventor: 刘发强 , 张震 , 石瑾 , 李鹏 , 刁则鸣 , 黄远 , 仇艺 , 张梦影 , 袁堂岭 , 尚程 , 阿曼太 , 梁彧 , 蔡琳 , 杨满智 , 王杰 , 田野 , 金红 , 陈晓光 , 傅强
Abstract: 本发明实施例公开了一种异常呼叫检测方法、装置、设备及介质。该方法包括:获取多种类型的通话记录描述数据;根据各通话记录描述数据形成至少一个多源数据分组,多源数据分组中包括至少两种类型的通话记录描述数据;将每个多源数据分组中包括的各通话记录描述数据进行关联分析,形成与每个多源数据分组分别对应的异常呼叫检测结果。在上述技术方案中,通过对多种类型的通话记录描述数据进行关联分析,得到异常呼叫检测结果,实现了有效地对异常呼叫进行安全监管,提高了异常呼叫的检测精确度。
-
公开(公告)号:CN112148872A
公开(公告)日:2020-12-29
申请号:CN202011043378.1
申请日:2020-09-28
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 恒安嘉新(北京)科技股份公司
IPC: G06F16/34 , G06F16/332 , G06F16/33 , G06F40/289 , G06K9/62
Abstract: 本公开实施例公开了一种自然对话主题分析方法、装置、电子设备、及存储介质,方法包括:获取多个自然对话文本,对任一自然对话文本进行切和分词处理得到分词序列;将根据所述多个自然对话文本得到的分词序列集合进行聚合分组分成多个分词序列子集合;对任一分词序列子集合提取核心关键词;对任一分词序列子集合中任一分词序列,分别计算任意两个核心关键词词序字符串的莱文斯坦距离以获取主题纯度;根据所述分词序列集合所包含的各分词序列子集合的主题纯度和对应的关键词集合,进行分析结果输出。本实施例的技术方案能够直接根据批量或海量的自然对话分析主题,无需人工参与,能提高主题分析效率。
-
公开(公告)号:CN113286035A
公开(公告)日:2021-08-20
申请号:CN202110529065.5
申请日:2021-05-14
Applicant: 国家计算机网络与信息安全管理中心 , 恒安嘉新(北京)科技股份公司
Inventor: 刘发强 , 张震 , 石瑾 , 李鹏 , 刁则鸣 , 黄远 , 仇艺 , 张梦影 , 袁堂岭 , 尚程 , 阿曼太 , 梁彧 , 蔡琳 , 杨满智 , 王杰 , 田野 , 金红 , 陈晓光 , 傅强
Abstract: 本发明实施例公开了一种异常呼叫检测方法、装置、设备及介质。该方法包括:获取多种类型的通话记录描述数据;根据各通话记录描述数据形成至少一个多源数据分组,多源数据分组中包括至少两种类型的通话记录描述数据;将每个多源数据分组中包括的各通话记录描述数据进行关联分析,形成与每个多源数据分组分别对应的异常呼叫检测结果。在上述技术方案中,通过对多种类型的通话记录描述数据进行关联分析,得到异常呼叫检测结果,实现了有效地对异常呼叫进行安全监管,提高了异常呼叫的检测精确度。
-
公开(公告)号:CN114265932A
公开(公告)日:2022-04-01
申请号:CN202111530106.9
申请日:2021-12-10
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 讯飞智元信息科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/211 , G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明公开一种融入深度语义关系分类的事件脉络生成方法及系统,所述方法包括如下步骤:对新闻数据集合进行分词,合并后生成词文档序列;训练主题模型,利用训练好的主题模型来完成主题的聚类,得到主题聚类结果;将所有的关键词拼接后输入到bert模型中,最终的新闻文本向量表示为所有token的向量的平均;对于每个主题下获得的所有事件进行分支确定,得到每个主题对应的分支集合,将每个分支中的事件按照时间先后顺序连接,并将分支也按照时间先后顺序连接,即按照分支中最早事件的时间先后顺序连接,最终获得事件脉络。本发明通过结合基于主题模型的文本聚类方法和基于深度语义的事件聚类方法完成事件脉络的生成过程。
-
公开(公告)号:CN114267333A
公开(公告)日:2022-04-01
申请号:CN202111509949.0
申请日:2021-12-10
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 讯飞智元信息科技有限公司
IPC: G10L15/00 , G10L15/06 , G06F40/126 , G06F40/242
Abstract: 本发明公开了一种混合双语语音识别方法及系统,所述方法包括如下步骤:数据处理步骤,包括:对一定量的目标双语音频数据和目标双语文本语料执行BPE共享词典制作、数据增广和特征提取操作,为后端网络训练提供有效数据输入;Encoder‑Decoder训练步骤,包括:对所述数据处理步骤获得的有效数据采用Transformer结构训练语音识别器。本发明涉及双语混合连续语音识别技术领域。根据输入的目标语种的单语语音数据、双语混合语音数据或者双语混杂语音数据,自动转写出语音的内容信息。
-
公开(公告)号:CN113115363A
公开(公告)日:2021-07-13
申请号:CN202110426526.6
申请日:2021-04-20
Applicant: 国家计算机网络与信息安全管理中心
Inventor: 倪善金 , 万辛 , 黄远 , 孙晓晨 , 宁珊 , 沈亮 , 高圣翔 , 计哲 , 杨晶超 , 张震 , 李鹏 , 石瑾 , 李沁 , 侯炜 , 刁则鸣 , 刘发强 , 孙旭东 , 王立强 , 刘睿霖
IPC: H04W28/02 , H04W28/08 , H04B17/318 , H04B17/382
Abstract: 本公开提供一种异构网络中的移动通信方法、装置与电子设备。异构网络中的移动通信方法包括:确定目标用户在所述目标异构网络中的目标位置确定所述目标位置处于所述目标低功率节点的目标信号范围内,所述目标信号范围是根据所述目标低功率节点与所述宏基站之间的目标信号强度边界和所述目标信号强度边界的目标范围扩展基基确定的将所述目标用户与所述宏基站之间通信切换为所述目标用户与所述目标低功率节点进行通信。本公开实施例提供的技术方案可以通过低功率节点的覆盖边界扩展,降低宏基站的负载,提高异构网络中用户的网络信号强度,增强系统的可靠性和频谱效率。
-
公开(公告)号:CN119046775A
公开(公告)日:2024-11-29
申请号:CN202411131128.1
申请日:2024-08-17
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2411 , G06F18/213 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及信息技术领域,具体公开了一种基于图神经网络的异常用户分类方法,包括:S1、数据预处理与图构建,S2、节点表示分解,S3、生成基于同配度矩阵的伪标签,S4、信号聚合,S5、模型设计,S6、损失函数设计和S7、节点分类方法;本发明使用Weisfeiler‑Lehman同构测试和同配度矩阵的伪标签生成方法,能够有效地减少训练时间和计算资源,高效的信号聚合方法也使得推理过程更加快速;通过分解节点表示和伪标签生成的方法,使得模型在做出决策时更加透明,可以理解模型是如何利用同配性和异配性信息进行判断的,从而增加了模型的可解释性和精度。
-
公开(公告)号:CN117556889A
公开(公告)日:2024-02-13
申请号:CN202311537400.1
申请日:2023-11-17
Applicant: 国家计算机网络与信息安全管理中心广东分中心
IPC: G06N3/098 , G06F21/62 , G06F21/60 , G06F18/24 , G06F18/213 , G06N3/048 , G06N3/0464 , G06N3/044
Abstract: 本发明公开的层次多标签场景的联邦学习方法,在层次多标签场景下通过获取到的标签类型构建有向无环图,并记录各客户端标签类型所在的有向无环图的层次,根据样本数据的特征和有向无环图来构建特征处理模型,其特征处理模型可获取不同层次的激活值,且各客户端可以通过自身所在层次获得对应层次的激活值,从而能够支撑后续的计算流程;然后通过计算无标签激活值的伪标签交叉熵损失,保证训练数据中有标签和无标签数据均有梯度回传,从而保护数据隐私,另外,通过计算相邻层次之间的相关性图的均方差损失,低层次客户端得以指导高层次客户端的参数优化,达到联邦学习的效果,从而提升了联邦学习在层次多标签场景下的安全可用性。
-
公开(公告)号:CN112738807A
公开(公告)日:2021-04-30
申请号:CN202011629934.3
申请日:2020-12-31
Applicant: 恒安嘉新(北京)科技股份公司
Inventor: 刘发强 , 张震 , 石瑾 , 李鹏 , 刁则鸣 , 黄远 , 仇艺 , 张梦影 , 袁堂岭 , 庞韶敏 , 梁彧 , 田野 , 傅强 , 王杰 , 杨满智 , 蔡琳 , 金红 , 陈晓光
IPC: H04W12/121 , H04W12/68 , H04M7/00
Abstract: 本发明实施例涉及一种发现有害GOIP设备的方法、装置、设备、及存储介质,方法包括:接收多个主动探测点获取的监测数据,其中所述多个主动探测点分别用于探测接入VOIP平台的家庭宽带/互联网的流量数据、从VOIP平台输出的互联网话单、以及移动网话单;对所述流量数据进行流量协议解析,将解析结果、所述互联网话单、以及所述移动网话单进行关联分析确定有害GOIP设备;对所获取的有害GOIP设备进行打击渗透。本发明的技术方案能够提高有害GOIP设备的发现概率,能够降低诈骗等犯罪率。
-
-
-
-
-
-
-
-
-