发明公开
- 专利标题: 快递号码识别的方法、装置、电子设备及存储介质
-
申请号: CN202210106569.0申请日: 2022-01-28
-
公开(公告)号: CN114547001A公开(公告)日: 2022-05-27
- 发明人: 周晓辉 , 陈美 , 陈益辉
- 申请人: 号百信息服务有限公司
- 申请人地址: 上海市虹口区四川北路61号13-19楼
- 专利权人: 号百信息服务有限公司
- 当前专利权人: 号百信息服务有限公司
- 当前专利权人地址: 上海市虹口区四川北路61号13-19楼
- 代理机构: 上海浦科知识产权代理有限公司
- 代理商 杨威炜
- 主分类号: G06F16/215
- IPC分类号: G06F16/215 ; G06F16/25 ; G06K9/62
摘要:
本发明涉及一种快递号码识别的方法、装置、电子设备及存储介质,快递号码识别的方法包括步骤:S1、输入快递号码黑白名单数据和信令话单数据,对数据以数据清洗,通过数据关联融合得到模型所需的原始数据集;S2、采用SMOTE TomeK算法对原始数据集进行综合采样,形成模型样本数据集;S3、将模型样本数据集划分为训练集和测试集,分别采用XGboost模型、NGboost模型、Catboost模型进行模型训练,形成初级模型;S4、采用五折交叉验证法训练XGboost模型、NGboost模型、Catboost模型,使用测试集进行验证,输出预测值;S5、将XGboost模型、NGboost模型、Catboost模型的输出值分别作为LightGBM模型的输入特征,形成次级模型,进行次级模型的训练,经训练后输出满足预先设定模型精度的模型,从而形成XNCLBoost模型。