发明公开
CN113095858A 一种涉诈短文本识别方法
审中-实审
- 专利标题: 一种涉诈短文本识别方法
-
申请号: CN202110497356.0申请日: 2021-05-07
-
公开(公告)号: CN113095858A公开(公告)日: 2021-07-09
- 发明人: 周小敏 , 应鸿晖 , 黄福鸿 , 卓采标 , 史燕飞 , 李高翔 , 叶宇中 , 石易 , 潘国良 , 陈金林 , 陈德兴 , 吴雁琛 , 曾茂晰
- 申请人: 广州市刑事科学技术研究所 , 国家计算机网络与信息安全管理中心广东分中心
- 申请人地址: 广东省广州市越秀区仓边路30号;
- 专利权人: 广州市刑事科学技术研究所,国家计算机网络与信息安全管理中心广东分中心
- 当前专利权人: 广州市刑事科学技术研究所,国家计算机网络与信息安全管理中心广东分中心
- 当前专利权人地址: 广东省广州市越秀区仓边路30号;
- 代理机构: 广州粤高专利商标代理有限公司
- 代理商 林丽明
- 主分类号: G06Q30/00
- IPC分类号: G06Q30/00 ; G06F16/335 ; G06F16/35 ; G06F40/194 ; G06F40/279 ; G06F40/30 ; G06N3/04 ; G06N3/08
摘要:
本发明为解决没有考虑对文本信息的过滤及涉诈类别的分类导致存在识别准确率和效率低的问题,提出一种涉诈短文本识别方法,包括以下步骤:获取待识别的短文本,对所述短文本中的正常短文本进行过滤,得到疑似涉诈短文本数据集;将所述疑似涉诈短文本数据集输入神经网络模型中提取语义特征;根据所述疑似涉诈短文本数据集中字符的拼音和笔顺与预设的涉诈关键词的相似度对所述疑似涉诈短文本数据集进行特征抽取得到人工特征,并基于预设的涉诈关键词进行硬匹配,得到硬匹配特征;将所述语义特征、人工特征和硬匹配特征进行特征融合后通过多分类算法进行建模训练,生成用于诈骗短文本识别的分类器,输出得到涉诈短文本识别结果。