-
公开(公告)号:CN114255739A
公开(公告)日:2022-03-29
申请号:CN202010996191.7
申请日:2020-09-21
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
摘要: 本发明实施例提供一种识别语音中关键词的方法及装置,其中,该方法包括:将待识别语音输入至语音识别模型,输出待识别语音对应的模糊发音空间;根据模糊发音空间,对关键词集进行搜索,获取待识别语音对应的关键词的识别结果;其中,模糊发音空间,用于表示待识别语音对应的多种语音识别结果。本发明实施例提供的识别语音中关键词的方法及装置,通过语音识别模型对待识别语音进行识别,获取多种可能的语音识别结果,组成模糊发音空间,将模糊发音空间和预先建立的关键词集进行匹配搜索,输出匹配到的关键词,使用模糊发音空间搜索的方法,能够成功处理语音的相似表达、语音中的吞字现象和语音中的发音不准确现象,能提高语音匹配的查全率。
-
公开(公告)号:CN116776833A
公开(公告)日:2023-09-19
申请号:CN202210233431.7
申请日:2022-03-09
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F40/151 , G06F40/205
摘要: 本发明公开了变体文本转译方法、处理设备及计算机可读存储介质,该方法包括:获取组成待译文本的每一的拼音集合,所述拼音集合包括所述组成汉字对应的第一拼音以及所述组成汉字的形近字对应的第二拼音;根据所述组成汉字的拼音集合,确定所述待译文本对应的拼音集合序列;将所述拼音集合序列作为预先训练的网络模型的输入参数,通过所述网络模型确定所述拼音集合序列对应的目标文本,并将所述目标文本作为所述待译文本的译文文本。达到了提取将变体文本转译为便于识别的文本的效果。
-
公开(公告)号:CN116738012A
公开(公告)日:2023-09-12
申请号:CN202210214487.8
申请日:2022-03-04
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/903 , G06F16/33 , G06F16/335
摘要: 本发明实施例涉及计算机数据处理技术领域,公开了一种不良消息识别方法,该方法包括:确定目标用户组对应的至少一条待识别消息;根据至少一条待识别消息按照消息发送顺序依次输入多模匹配模型,得到目标用户组对应的关键词匹配结果;其中,多模匹配模型根据预设的关键词集合构建;关键词匹配结果包括匹配关键词以及对应的匹配位置信息;每一条消息输入前,多模匹配模型的状态以及关键词匹配结果根据上一次输入的消息进行更新;根据关键词匹配结果以及关键词集合对应的至少一个关键词匹配策略确定至少一条待识别消息对应的消息识别结果。通过上述方式,本发明实施例提高了不良消息识别的准确率和效率。
-
公开(公告)号:CN115329066A
公开(公告)日:2022-11-11
申请号:CN202110448692.6
申请日:2021-04-25
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/35 , G06F16/31 , G06F16/383 , G06F40/194 , G06F40/216 , G06F40/284 , G06K9/62
摘要: 本发明公开了一种文本匹配方法、装置、计算设备及计算机存储介质,方法包括:匹配文本中的待审核关键词及其位置信息,查询包含待审核关键词的策略,将策略包含的逻辑运算符作为分支结点、关键词作为叶子结点,构建得到二叉树;针对叶子结点,若存在待审核关键词与其对应的关键词一致,则确定叶子结点的布尔值为真,在叶子结点保存一致的待审核关键词的位置信息;针对分支结点,根据逻辑运算符及两个子结点的布尔值进行运算得到该分支结点的布尔值,基于此确定保存在该分支结点的位置信息;若根结点的布尔值为真,则确定待审核文本命中关键词组合策略,并根据根结点保存的位置信息,输出待审核文本片段。该方式能够提高文本匹配的准确率和效率。
-
公开(公告)号:CN113869041A
公开(公告)日:2021-12-31
申请号:CN202010619049.0
申请日:2020-06-30
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F40/279 , G06F40/289 , G06F16/35
摘要: 本发明实施例提供一种关键词组合提取方法、装置和电子设备,其中方法包括:确定待识别文本;对所述待识别文本进行分词,对分词结果进行循环移位,得到所述待识别文本的二维增广矩阵;基于所述待识别文本的二维增广矩阵,确定所述待识别文本的关键词组合。本发明实施例提供的方法、装置和电子设备,提取得到的关键词组合能够全面地反映待识别文本的内容特征,提高了对垃圾信息的识别准确率。
-
公开(公告)号:CN118797596A
公开(公告)日:2024-10-18
申请号:CN202410662825.3
申请日:2024-05-27
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
摘要: 本公开提供了一种终端访问控制方法、装置、设备、介质及产品,其中,该方法包括:响应于终端设备的访问请求,基于所述终端设备的终端信息,在历史执行策略中确定所述访问请求的多个执行策略;其中,所述终端信息包括:所述终端设备对历史访问请求的访问记忆信息、终端状态信息;基于所述终端信息确定每个所述执行策略的策略评分结果;其中,所述策略评分结果用于指示每个所述执行策略的终端状态信息的状态评分,以及每个所述执行策略的访问记忆信息的匹配度评分;根据所述策略评分结果,在所述多个执行策略中确定满足评分要求的目标执行策略,并基于所述目标执行策略执行所述访问请求。
-
公开(公告)号:CN115204152A
公开(公告)日:2022-10-18
申请号:CN202110382534.5
申请日:2021-04-09
申请人: 中国移动通信集团设计院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F40/242 , G06F40/284 , G06F16/33 , G06F16/36
摘要: 本发明公开一种关键词变体的匹配方法,包括:合并第一待测文本中的拆分字;合并后的第一待测文本与关键词库中的关键词匹配,若其中不包含与关键词完全匹配的目标词,则获取其中每个目标字的头N笔和末M笔的笔画序列;在关键词库中查找各个目标字对应的疑似匹配关键词,确定各个目标字的匹配标识符;上述匹配标识符组成第1层匹配标识符序列,n赋值为2;计算第n‑1层相邻的匹配标识符的交集,得到第n层匹配标识符序列,判断第n层的匹配标识符对应的疑似匹配关键词的字数是否为n,若是,则输出匹配结果;若否,n赋值为n+1,重复执行本步骤,直至第n层匹配标识符序列不存在与关键词库中的疑似匹配关键词对应的标识符,该方法提高了匹配效率。
-
公开(公告)号:CN114519060A
公开(公告)日:2022-05-20
申请号:CN202011297031.X
申请日:2020-11-18
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC分类号: G06F16/23
摘要: 本发明提供一种数据处理方法、装置及设备,涉及通信技术领域。该方法包括:获取待检验的数据血缘中每个节点的数据信息,所述数据信息包括数据量和数据类型;根据每一数据类型,校验对应的第一节点和第二节点的数据量,得到第一校验结果;其中,所述第二节点是所述第一节点中第一数据的数据源节点,且所述第一数据属于当前校验的数据类型。本发明的方案,能够达到保障数据血缘可靠性的目的。
-
公开(公告)号:CN116415272A
公开(公告)日:2023-07-11
申请号:CN202210006930.2
申请日:2022-01-05
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
摘要: 本申请实施例公开了一种数据处理方法,包括:接收第一设备发送的具有分类的加密后的待处理词和每一类加密后的待处理词对应的簇索引,接收第二设备发送的加密后的具有策略标签的策略关键词;加密后的待处理词和加密后的策略关键词是采用同一目标密钥加密的;加密后的待处理词是待处理文本的样本文本中的词;基于加密后的策略关键词和策略标签对加密后的待处理词进行处理,得到待处理词中异常词和异常词的异常标签;从簇索引中确定异常词对应的目标簇索引,发送目标簇索引和异常标签至第一设备,使第一设备基于目标簇索引和异常标签确定待处理文本中的异常文本和待处理文本的标签。本申请实施例还公开了一种数据处理设备和计算机可读存储介质。
-
公开(公告)号:CN112134998A
公开(公告)日:2020-12-25
申请号:CN202010942755.9
申请日:2020-09-09
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
摘要: 本发明实施例涉及大数据分析领域,公开了一种码号区分方法、电子设备和计算机可读存储介质。上述码号区分方法包括:获取待检测码号的各特征;根据预设的码号区分逻辑图谱和所述各特征,确定所述待检测码号在所述码号区分逻辑图谱中,各节点的特征值;其中,所述各节点用于表示所述各特征之间的逻辑关系;根据所述各节点的特征值,确定所述待检测码号的码号类别。本发明实施例提供的码号区分方法,可以提高码号区分过程的准确性,有效区分码号类别,保障处于正常合规运营范围内的码号的正常使用,从而提升用户的业务体验。
-
-
-
-
-
-
-
-
-