-
公开(公告)号:CN111709472B
公开(公告)日:2022-09-23
申请号:CN202010543099.5
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种动态融合规则到诈骗行为识别模型的方法,包括:由全量通话记录生成电信通联网络:G={V,E,Y},并据此构建识别诈骗行为的时空图;读取诈骗行为识别规则表中的每条规则,计算每个用户对应于每条规则的转换值;将每个用户对应于规则的转换值构成每个用户的通话特征指标向量,每个用户的通话特征指标向量即是时空图中每个用户的节点特征;构建、并训练诈骗行为识别模型,然后将待识别用户的节点特征输入至诈骗行为识别模型,并根据模型输出判断待识别用户是否是可疑诈骗行为号码。本发明属于信息技术领域,能实现规则和模型的动态融合,从而实时检测、并准确识别各种诈骗行为。
-
公开(公告)号:CN111669757B
公开(公告)日:2023-03-14
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN111709472A
公开(公告)日:2020-09-25
申请号:CN202010543099.5
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种动态融合规则到诈骗行为识别模型的方法,包括:由全量通话记录生成电信通联网络:G={V,E,Y},并据此构建识别诈骗行为的时空图;读取诈骗行为识别规则表中的每条规则,计算每个用户对应于每条规则的转换值;将每个用户对应于规则的转换值构成每个用户的通话特征指标向量,每个用户的通话特征指标向量即是时空图中每个用户的节点特征;构建、并训练诈骗行为识别模型,然后将待识别用户的节点特征输入至诈骗行为识别模型,并根据模型输出判断待识别用户是否是可疑诈骗行为号码。本发明属于信息技术领域,能实现规则和模型的动态融合,从而实时检测、并准确识别各种诈骗行为。
-
公开(公告)号:CN111708887A
公开(公告)日:2020-09-25
申请号:CN202010542354.4
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种自定义规则的多模型融合的不良呼叫识别方法,包括:构建规则策略模型:设置若干条规则,将多条规则通过逻辑运算符连接构成策略,并设置策略的模型融合方式,由所有策略构成规则策略模型;构建识别不良呼叫的卷积神经网络和基于不良呼叫投诉的BERT文本分类模型;根据策略包含的规则的计算式,为每条策略生成递归计算表达式,然后执行递归计算表达式以获得策略执行结果,同时,运行卷积神经网络和BERT文本分类模型以获得输出结果,最后根据每条策略的模型融合方式和执行结果、卷积神经网络和BERT文本分类模型的输出结果,计算得到不良呼叫识别结果。本发明属于信息技术领域,能将规则和隐性表征模型有效融合到不良呼叫识别技术中。
-
公开(公告)号:CN111669757A
公开(公告)日:2020-09-15
申请号:CN202010542362.9
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
IPC: H04W12/12 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/04
Abstract: 一种基于通话文本词向量的终端诈骗电话识别方法,包括:用户在终端App中标记来话,当标记为诈骗类别时,经用户授权同意后转化为文本,由用户检视和脱敏,并在用户授权后上传服务器保存为文本样本;对文本样本进行分词和词性标注,获得分词的句法依存标签和词组合向量,再将词组合向量、词性标注和句法依存标签拼合构成分词的内容向量,计算分词所属的情景要素标签,以获得文本样本的语义向量;构建诈骗分类识别模型,使用服务器中文本样本作为训练样本,然后将训练好的模型从服务器端推送给App;App接收新的待识别通话后,根据模型获得其所属的涉诈类别,并提示用户。本发明属于信息技术领域,能基于通话文本准确识别诈骗电话。
-
公开(公告)号:CN111708887B
公开(公告)日:2022-09-23
申请号:CN202010542354.4
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种自定义规则的多模型融合的不良呼叫识别方法,包括:构建规则策略模型:设置若干条规则,将多条规则通过逻辑运算符连接构成策略,并设置策略的模型融合方式,由所有策略构成规则策略模型;构建识别不良呼叫的卷积神经网络和基于不良呼叫投诉的BERT文本分类模型;根据策略包含的规则的计算式,为每条策略生成递归计算表达式,然后执行递归计算表达式以获得策略执行结果,同时,运行卷积神经网络和BERT文本分类模型以获得输出结果,最后根据每条策略的模型融合方式和执行结果、卷积神经网络和BERT文本分类模型的输出结果,计算得到不良呼叫识别结果。本发明属于信息技术领域,能将规则和隐性表征模型有效融合到不良呼叫识别技术中。
-
公开(公告)号:CN111726460A
公开(公告)日:2020-09-29
申请号:CN202010542365.2
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于时空图的诈骗号码识别方法,包括:由全量通话记录生成电信通联网络,并构建识别诈骗号码的时空图,使用Snapshot方法按时间间隔T、从图中连续截取出多张时空子图;基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从时空子图中提取和其有相同被叫的邻居用户;构建、并训练识别诈骗号码的时空图神经网络;将待识别目标用户和其所有邻居用户在所有时空子图中的通话特征指标向量输入时空图神经网络,并根据输出判断待识别目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能动态的捕获到号码呼叫行为的变化,从而实现诈骗号码的精准识别。
-
公开(公告)号:CN111726460B
公开(公告)日:2021-04-20
申请号:CN202010542365.2
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于时空图的诈骗号码识别方法,包括:由全量通话记录生成电信通联网络,并构建识别诈骗号码的时空图,使用Snapshot方法按时间间隔T、从图中连续截取出多张时空子图;基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从时空子图中提取和其有相同被叫的邻居用户;构建、并训练识别诈骗号码的时空图神经网络;将待识别目标用户和其所有邻居用户在所有时空子图中的通话特征指标向量输入时空图神经网络,并根据输出判断待识别目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能动态的捕获到号码呼叫行为的变化,从而实现诈骗号码的精准识别。
-
公开(公告)号:CN118568487A
公开(公告)日:2024-08-30
申请号:CN202410548464.X
申请日:2024-05-06
Applicant: 国家计算机网络与信息安全管理中心 , 国家计算机网络与信息安全管理中心天津分中心 , 中国科学院自动化研究所
IPC: G06F18/214 , G06F18/25 , G06F18/2431 , G06N3/042
Abstract: 本申请实施例提供一种多模态轻量级动态知识增强方法、装置及存储介质,所述方法包括:基于图像小样本集的向量表征和文本小样本集的向量表征,以多模态视觉码书的形式构建图像小样本知识库和文本小样本知识库;基于单模态搜索的方式从所述图像小样本知识库或所述文本小样本知识库中确定待融合表征的跨模态表征,融合所述待融合表征和所述跨模态表征,得到知识增强后的融合表征。本申请实施例提供的多模态轻量级动态知识增强方法、装置及存储介质,在现有大规模预训练多模态模型的强大表征学习基础上,融合罕见且细粒度的跨模态表征信息,以此提高原始表征的质量,并显著提升对特定信息的检索效率。
-
公开(公告)号:CN118520929A
公开(公告)日:2024-08-20
申请号:CN202411003497.2
申请日:2024-07-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N3/09 , G06N3/0455 , G06F40/194
Abstract: 本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
-
-
-
-
-
-
-
-
-