- 专利标题: 一种基于文本挖掘的金融类逾期短信智能判别方法
-
申请号: CN201610951973.2申请日: 2016-11-02
-
公开(公告)号: CN106547738B公开(公告)日: 2019-05-07
- 发明人: 邱峰 , 张满才
- 申请人: 北京亿美软通科技有限公司
- 申请人地址: 北京市朝阳区四惠东通惠河畔创意文化产业园1131号君天大厦6层
- 专利权人: 北京亿美软通科技有限公司
- 当前专利权人: 北京亿美软通科技有限公司
- 当前专利权人地址: 北京市朝阳区四惠东通惠河畔创意文化产业园1131号君天大厦6层
- 代理机构: 北京永创新实专利事务所
- 代理商 祗志洁
- 主分类号: G06F17/27
- IPC分类号: G06F17/27 ; G06Q40/02
摘要:
本发明公开了一种基于文本挖掘的金融类逾期短信智能判别方法,属于文本数据挖掘领域。本发明方法主要包括:获取短信文本进行分词,计算短信文本的相似度,提取短信模板;对短信模板抽样标注是否为金融逾期短信;对所有短信模板进行分词,挖掘新词和领域词组,形成新词库;用新词库对短信模板重新分词,提取对逾期判别具有重要价值的分词,组成特征向量空间;将标注的短信模板作为训练数据,采用支持向量机算法训练金融逾期分类器模型,训练好后输入所有短信,进行逾期分类判别。采用本发明方法,可以快速地从大量短信文本中提取金融逾期类相关的短信,从而为个人征信业务提供重要参考价值。
公开/授权文献
- CN106547738A 一种基于文本挖掘的金融类逾期短信智能判别方法 公开/授权日:2017-03-29