一种基于聚类和分类的异常订单辨识方法

    公开(公告)号:CN118551300A

    公开(公告)日:2024-08-27

    申请号:CN202310155914.4

    申请日:2023-02-23

    摘要: 本发明公开了一种基于聚类和分类的异常订单辨识方法,首先对获取的订单数据进行预处理并进行特征提取,之后进行多维DBSCAN聚类,初步筛选出与出租车群体运动总体行为相偏离的异常行为,并对聚类中划分出的正常簇进行隔离森林异常检测筛选异常值来增补聚类的异常簇中的异常点,最后利用XGboost模型对聚类结果数据进行训练,并基于此模型确定异常簇中的订单数据SHAP值,之后基于异常簇订单数据的特征参数与SHAP值,完成异常订单的辨识。本发明的异常订单辨识基于聚类和隔离森林算法进行双重异常检测,提高对异常订单识别的检测率,并基于XGboost模型和SHAP值对异常数据打标签,提供对这些行为的解释,有助于对异常情况进行分析和管理。

    一种基于密度聚类方法的出租车异常订单识别方法

    公开(公告)号:CN113673571A

    公开(公告)日:2021-11-19

    申请号:CN202110829406.0

    申请日:2021-07-22

    IPC分类号: G06K9/62 G06Q50/30

    摘要: 本发明公开了一种基于密度聚类方法的出租车异常订单识别方法,本技术方案基于出租车订单数据,提取订单的相关时空特征,对可能异常订单进行识别的方法。首先,对原始数据进行预处理,包括数据的坐标系转换以及数据的清洗;随后对预处理后的数据进行网格化处理;之后,通过基于密度聚类的方法,对各相似订单簇中的异常样本点进行识别;最后对异常识别结果进行分析,获得可能异常订单的时空分布特征。本发明基于聚类算法,能够实现可能异常订单的自动识别,并通过网格划分对相似订单进行集计,并对结果进行修正,能够显著提升算法的准确性。