异常数据挖掘方法、装置、设备及介质

    公开(公告)号:CN114443738A

    公开(公告)日:2022-05-06

    申请号:CN202210264250.0

    申请日:2022-03-17

    摘要: 本申请公开了一种异常数据挖掘方法、装置、设备及介质,包括:采集第一待检测数据、第一待检测数据的元数据以及与第一待检测数据相关的日志数据,从日志数据中剔除满足预设无效条件的无效数据,获得目标日志数据;确定出第一待检测数据的第一异常数据,在第一待检测数据中剔除第一异常数据,获得第二待检测数据,将第二待检测数据进行聚类,以获得多个聚类簇,并计算出每个聚类簇的中心数据,基于中心数据及其对应的聚类簇中的第二待检测数据之间的第一距离确定出离群点候选数据;将满足预设异常条件的离群点候选数据确定为第二异常数据,然后将第一异常数据和第二异常数据作为目标异常数据。实现适应性高、成本低且效率高的异常数据挖掘。

    数字员工AI智能流程编排方法

    公开(公告)号:CN115578729B

    公开(公告)日:2023-03-21

    申请号:CN202211457579.5

    申请日:2022-11-21

    摘要: 本发明公开了数字员工AI智能流程编排方法,包括:采集带有流程信息的纸质文件的原始图像,对原始图像进行差异灰度化,得到若干差异灰度化图像;对差异灰度化图像进行预设角度的旋转,得到若干旋转灰度化图像;对旋转灰度化图像进行膨胀,利用霍夫变换检测膨胀后每行字符形成的字符直线,得到字符走向图;根据字符走向图对膨胀前的旋转灰度化图像进行透视变换,得到矫正图;提取矫正图中的箭头标识,以箭头标识作为辅助信息对矫正图进行仿射变换,旋转得到还原图,将还原图二值化后输入至字符识别模块进行识别,依次提取流程信息完成编排。本发明可以得到准确的文字走向,避免特殊角度等原因导致的识别错误,有利于提高处理速度和准确性。

    基于图像模型和语言模型的事理关系抽取处理方法及系统

    公开(公告)号:CN114707004B

    公开(公告)日:2022-08-16

    申请号:CN202210569919.7

    申请日:2022-05-24

    IPC分类号: G06F16/36 G06F17/10

    摘要: 本发明提供了一种基于图像模型和语言模型的事理关系抽取处理方法及系统,包括:基于语言模型提取事件类型信息、以及每个事件类型信息所对应的第二事件主体;选中与事件类型信息相对应的第二事件主体,确定所述第一事件主体和所选中的第二事件主体之间的逻辑图像,基于神经网络模型对逻辑图像进行识别得到事件逻辑信息;根据第一事件主体、第二事件主体之间的事件类型信息、事件逻辑信息生成事理关系图谱;确定事理关系图谱中相对应的一维事件类型信息、一维事件逻辑信息,根据一维事件逻辑信息确定相应的第二事件主体为一级动作事件主体;一级动作事件主体和/或二级动作事件主体根据相应的一维事件类型信息和/或二维事件类型信息进行动作。