一种诈骗文本命名实体识别方法及系统

    公开(公告)号:CN113642328A

    公开(公告)日:2021-11-12

    申请号:CN202010343089.7

    申请日:2020-04-27

    Abstract: 本发明提出一种诈骗文本命名实体识别方法,包括:收集诈骗文本,对诈骗文本进行类别标记;使用诈骗文本和类别标记过的诈骗文本进行诈骗文本模型训练,生成诈骗文本命名实体判断模型;接收新通信文本,使用诈骗文本命名实体判断模型对新通信文本进行分析,获取新通信文本中的命名实体及类别。本发明针对诈骗文本手段不断变化,收集大量的历史诈骗文本,构建诈骗文本命名实体判断模型,周期性收集多条历史诈骗文本的相关数据对诈骗文本命名实体判断模型进行自回溯验证,对新通讯文本命名实体识别进行实时验证,实现系统自动化分析处理与人工校准相结合,有效识别新型诈骗文本中的命名实体,通过自动验证不断完善系统模型,实现系统自动化。

    一种诈骗短信识别方法及识别系统

    公开(公告)号:CN110267272A

    公开(公告)日:2019-09-20

    申请号:CN201910572213.4

    申请日:2019-06-28

    Abstract: 本发明涉及一种诈骗短信识别方法及识别系统,该方法包括:收集多条历史诈骗短信的相关数据,并从每条历史诈骗短信的相关数据提取历史诈骗短信的特征向量和诈骗类别;根据历史诈骗短信的特征向量和诈骗类别进行诈骗短信模型训练,获取诈骗短信判断模型;接收新短信的相关数据,并从每条新短信的相关数据中提取新短信的特征向量;将新短信的特征向量输入诈骗短信判断模型中,获取新短信是否属于诈骗短信以及属于哪种诈骗类别。本发明收集并根据多条历史诈骗短信的相关数据获取诈骗短信判断模型,该诈骗短信判断模型基于历史诈骗短信的相关数据,不限于短信内容,使得诈骗短信判断模型能够从多方面综合判断新短信是否属于诈骗短信以及哪种诈骗短信。

    一种口语化短文本的实体属性提取方法及电子装置

    公开(公告)号:CN113761919B

    公开(公告)日:2025-01-07

    申请号:CN202010500426.9

    申请日:2020-06-04

    Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。

    一种口语化短文本的实体属性提取方法及电子装置

    公开(公告)号:CN113761919A

    公开(公告)日:2021-12-07

    申请号:CN202010500426.9

    申请日:2020-06-04

    Abstract: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。

Patent Agency Ranking