-
公开(公告)号:CN118803604A
公开(公告)日:2024-10-18
申请号:CN202311546858.3
申请日:2023-11-20
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC分类号: H04W4/14 , H04W12/128 , G06N5/025 , G06F16/36 , G06F16/903
摘要: 本申请涉及数据处理技术领域,提供一种短信管理策略生成方法、装置、电子设备及存储介质,方法包括:获取待处理短信;基于所述待处理短信进行字符子串提取,得到子串集;基于所述子串集与关键词知识图谱进行关键词匹配,得到目标关键词;所述关键词知识图谱是基于预设关键词及其变体、引申、替代的关联词构建的;基于所述目标关键词与所述关键词知识图谱确定短信拦截策略,以基于所述短信拦截策略进行短信拦截。本申请可以快速、准确地识别出待处理短信中,由关键词进行变体、引申或替代形成的新的关键词,进而快速、准确地确定出短信拦截策略,便于相关人员参考短信拦截策略进行垃圾短信拦截,因此可以提高垃圾短信拦截的准确性。
-
公开(公告)号:CN118797111A
公开(公告)日:2024-10-18
申请号:CN202410215600.3
申请日:2024-02-27
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/903 , G06F18/22 , G06Q50/50
摘要: 本发明提供一种隐私信息泄露情况检测方法、设备及存储介质,涉及信息安全技术领域,所述方法包括:获取已泄露信息以及自有隐私信息;根据已泄露信息以及自有隐私信息,获取第一预设字符长度的第一字符串组以及第二字符串组;将第一字符串组与第二字符串组对比,获取第三字符串组,进而获取最大公共序列字符串生成第一泄露情况信息。基于第一预设字符长度为单位获取字符串,避免格式限制从已泄露信息中提取与自有隐私信息一致的关键字符串,通过连续相同字符重合的方式扩展字符串,找出最大公共序列字符串,适应提取长度存在变化、结构复杂的信息,对于部分信息泄露的情况,亦能够准确发现泄露部分的信息,提高对隐私泄露情况判断的准确性。
-
公开(公告)号:CN118803133A
公开(公告)日:2024-10-18
申请号:CN202411005723.0
申请日:2024-07-25
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC分类号: H04M3/22 , H04W12/122
摘要: 本发明涉及通信技术领域,提供一种异常号码检测方法及装置,该方法包括:获取一个检测周期内主叫号码、被叫号码以及表示主叫号码和被叫号码各属性信息的结构化数据;清洗结构化数据,以去除构建三元组所需关键信息缺失的结构化数据;构建通话三元组;将具有相同关系的通话三元组转换成通话关系图;将通话关系图输入图神经网络,得到图神经网络输出的任一号码在每个关系下的号码节点嵌入,基于所有关系对应的号码节点嵌入生成任一号码对应的当前的总号码节点嵌入;基于当前的总号码节点嵌入更新节点嵌入存储数据库;基于更新后的节点嵌入存储数据库和作为参考的已知违规号码确定一个检测周期内的异常号码。本发明提高了异常号码的检测效率。
-
公开(公告)号:CN118798335A
公开(公告)日:2024-10-18
申请号:CN202311541088.3
申请日:2023-11-17
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
摘要: 本申请涉及知识图谱构建领域,提供一种知识图谱构建方法、装置、设备及可读存储介质。知识图谱构建方法包括:对待处理新闻数据进行文本预处理得到词语序列;基于词语序列对待处理新闻进行分类和提取,得到目标知识元;基于目标知识元以及预设构建方式,构建目标知识三元组;基于目标知识三元组生成目标知识图谱。本申请通过从新闻文本中获取最新的反欺诈知识,提取出用于识别欺诈内容的关键词实体至知识图谱中,确保在反欺诈内容识别环节能够及时针对新型欺诈要素进行响应,解决涉诈关键词库缺乏时效性的问题。
-
公开(公告)号:CN117992616A
公开(公告)日:2024-05-07
申请号:CN202211372801.1
申请日:2022-11-01
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/36 , G06F16/33 , G06F40/194 , G06F40/30
摘要: 本申请实施例公开了一种不良关键词知识图谱的构建方法及相关设备,解决了关键词策略难以被算法利用且无法对外共享的问题。该方法包括:根据关键词策略集合构建基础知识图谱,所述关键词策略中每个关键词策略包括N个关键词,所述N个关键词之间为布尔逻辑关系,其中,N为大于或等于1的整数;根据所述基础知识图谱以及所述关键词策略集合确定所述关键词策略集合中每个关键词策略所对应的替代关系和引申关系;将所述替代关系和所述引申关系融入所述基础知识图谱,以得到所述不良关键词知识图谱。
-
公开(公告)号:CN116415272A
公开(公告)日:2023-07-11
申请号:CN202210006930.2
申请日:2022-01-05
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
摘要: 本申请实施例公开了一种数据处理方法,包括:接收第一设备发送的具有分类的加密后的待处理词和每一类加密后的待处理词对应的簇索引,接收第二设备发送的加密后的具有策略标签的策略关键词;加密后的待处理词和加密后的策略关键词是采用同一目标密钥加密的;加密后的待处理词是待处理文本的样本文本中的词;基于加密后的策略关键词和策略标签对加密后的待处理词进行处理,得到待处理词中异常词和异常词的异常标签;从簇索引中确定异常词对应的目标簇索引,发送目标簇索引和异常标签至第一设备,使第一设备基于目标簇索引和异常标签确定待处理文本中的异常文本和待处理文本的标签。本申请实施例还公开了一种数据处理设备和计算机可读存储介质。
-
公开(公告)号:CN112202720B
公开(公告)日:2023-05-02
申请号:CN202010921468.X
申请日:2020-09-04
申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司
IPC分类号: H04L69/22 , G06N3/08 , G06N3/0442
摘要: 本发明实施例提供了一种音视频识别方法、装置、电子设备及计算机存储介质。该音视频识别方法,包括:在待识别数据流的包识别码PID解析失败的情况下,获取神经网络记忆单元中与待识别数据流大小相同的训练数据;根据训练数据的属性信息,对待识别数据流进行解码,得到解码处理结果;计算解码处理结果和训练数据的差值;在确定差值满足预设条件的情况下,根据解码处理结果,确定待识别数据流为视频流或音频流。根据本发明实施例的音视频识别方法、装置、电子设备及计算机存储介质,能够在待识别数据流的PID解析失败的情况下,准确地识别音视频。
-
公开(公告)号:CN118820462A
公开(公告)日:2024-10-22
申请号:CN202410058598.3
申请日:2024-01-15
申请人: 中国移动通信集团有限公司
IPC分类号: G06F16/35 , G06F16/33 , G06F16/335 , G06F40/289 , G06F18/2431 , G06F18/2415 , G06N3/0455 , G06N3/047 , G06N3/08
摘要: 本申请提供一种模型训练方法、信息提取方法、装置、电子设备和计算机存储介质,该方法应用于信息安全技术领域,该方法包括:获取第一信息文本集;所述第一信息文本集包括多条原始信息文本;对所述第一信息文本集进行预处理,得到训练数据集;所述训练数据集包括多条信息文本以及每条信息文本对应的类别标签和位置标签;利用所述训练数据集对初始信息提取模型进行训练,得到类别损失和位置损失;所述初始信息提取模型用于确定电子地址类别和电子地址位置;基于所述类别损失和位置损失,对所述初始信息提取模型的参数进行调整,得到训练完成的信息提取模型。如此,可以提升电子地址的提取精确度。
-
公开(公告)号:CN118133300A
公开(公告)日:2024-06-04
申请号:CN202211502743.X
申请日:2022-11-28
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC分类号: G06F21/60 , G06F21/62 , G06F16/22 , G06F16/2458
摘要: 本申请公开了一种结构化数据的水印嵌入方法、提取方法、装置、电子设备及存储介质。其中,方法包括:获取第一数据集和水印信息;对所述第一数据集中的数据进行筛选处理,得到所述第一数据集中待嵌入水印信息的目标属性数据;对所述水印信息进行分片处理,得到所述水印信息对应的分片数据;基于所述目标属性数据、所述分片数据和预设分片信息库确定所述目标属性数据中各属性字段的待嵌入水印分片数据序列;将所述待嵌入水印分片数据序列嵌入所述目标属性数据,得到嵌入水印的第二数据集。
-
公开(公告)号:CN116975338A
公开(公告)日:2023-10-31
申请号:CN202211547347.9
申请日:2022-12-05
申请人: 中国移动通信集团有限公司
IPC分类号: G06F16/535 , G06F16/583 , G06V10/74 , G06V10/56
摘要: 本申请公开了一种图片指纹过滤方法、装置、设备及可读存储介质,该方法包括步骤:提取待检测图片的低频指纹,并计算所述低频指纹与预设低频指纹库中的不良图片所对应指纹之间的各低频汉明距离;若确定所述待检测图片为近似纯色图片,则提取所述待检测图片的高频指纹;计算所述高频指纹与所述低频汉明距离中用于参考的低频汉明距离所对应指纹的各高频汉明距离;若所述各高频汉明距离中存在小于预设距离阈值的目标高频汉明距离,则确定所述待检测图片为不良图片,并对其过滤处理。本申请实现了提高对近似纯色图片进行过滤的精准性。
-
-
-
-
-
-
-
-
-