一种异常话单处理方法及处理系统

    公开(公告)号:CN114244963A

    公开(公告)日:2022-03-25

    申请号:CN202111544194.8

    申请日:2021-12-16

    IPC分类号: H04M15/00 H04M15/10

    摘要: 本发明公开了一种异常话单处理方法及处理系统,所述异常话单处理方法利用话单文本信息可依次判断话单是否为有效的外网话单、是否为交叉话单、是否为无主话单,并将最终经过处理后的话单存储至计费系统的机主‑主叫号码‑话单表中,用于后期计费使用,其中,判断话单是否为有效的外网话单、判断话单是否为交叉话单的步骤可以将无需计费的话单排除至计费系统外,判断话单是否为无主话单的步骤可以自动找到无主话单的机主并将其计入计费系统,避免了因计费系统与电网行政交换网信息不同步而导致无主话单无法计费的问题,另外,该步骤还可以将无主话单对应的主机号码自动加入到计费系统,实现计费系统中主机号码与机主对应信息的自动更新。

    一种基于爬虫网络框架的数据采集储存系统及其方法

    公开(公告)号:CN114238734A

    公开(公告)日:2022-03-25

    申请号:CN202111489435.3

    申请日:2021-12-08

    IPC分类号: G06F16/951 G06F16/955

    摘要: 本发明公开了一种基于爬虫网络框架的数据采集储存系统及其方法,包括爬虫引擎、调度器、下载器、解析器、存储管道,调度器、下载器、解析器分别与爬虫引擎信号连接;通道包括项目管道、业务逻辑模块;业务逻辑模块在项目管道中分拣结构化数据和非结构数据,并将不同类别的数据存储至不用的存储模块中;调度器与下载器中间设置有去重模块,去重模块采用MD5算法对URL去重。现有技术去重模块设置的位置一般在存储通道位置,其去重时间长,爬取网页速度慢,本发明设置在调度器与下载器数据传递之间,节省了去重时间;另外,本发明存储通道具备MongoDB集群技术,结构化数据和非结构化数据最后统一整合至MongoDB集群中,具备通用性。