-
公开(公告)号:CN110032494A
公开(公告)日:2019-07-19
申请号:CN201910218832.3
申请日:2019-03-21
申请人: 杭州电子科技大学
IPC分类号: G06F11/30
摘要: 本发明公开了一种基于关联关系的双粒度噪声日志过滤方法。该方法基于局部依赖度和全局依赖度计算得到混合依赖度,通过本发明方法能够同时实现日志中噪声事件的细粒度过滤和噪声轨迹的粗粒度过滤。相比于传统的日志过滤方法,本发明具有如下收益:1、采用了双粒度过滤机制,对于不同的噪声情景使用不同的过滤机制,从而在尽可能保留原始日志数据的情况下实现了优秀的过滤效果;2、使用过滤后的日志文件用于流程挖掘能极大提高流程发现模型的精度,增强了模型的可理解性。
-
公开(公告)号:CN106095955A
公开(公告)日:2016-11-09
申请号:CN201610424544.X
申请日:2016-06-16
申请人: 杭州电子科技大学
CPC分类号: G06F17/30705 , G06Q10/0633
摘要: 本发明公开了一种基于业务流程日志和实体轨迹配对的行为模式挖掘方法。本发明将事件日志数据集转换成实体轨迹数据集,通过使用合成聚类算法来对这些实体轨迹数据集进行分层聚类,得到一个实体轨迹ID向导树,以该向导树为索引,得到包含所有实体轨迹数据集的配对矩阵;然后再通过遍历该配对矩阵将活动名称属性相同的元素划分在一起得到活动块,并根据活动块中的活动名称属性和活动执行者属性组合出现的次数之和、各自出现的次数选择出较频繁的活动块和组合并得到这些频繁的活动块和活动块中频繁的组合之间的结构关系。本发明从协作的角度出发挖掘非结构化业务流程中存在的一些固定行为模式,对于非结构化业务流程的有效分析具有很重要的意义。
-
公开(公告)号:CN107909344B
公开(公告)日:2020-07-17
申请号:CN201711165952.9
申请日:2017-11-21
申请人: 杭州电子科技大学
IPC分类号: G06Q10/10
摘要: 本发明公开了一种基于关系矩阵的工作流日志重复任务识别方法。本发明采用对日志事件先分类再聚类的策略,在划分过程中通过寻找具有稳定结构的循环和并行结构,减少划分种类。在聚类过程中,根据事件上下文计算候选重复任务集合中两两之间相似度,在每次聚类过程中计算模型质量,最终聚类完成后选择最优聚类方案,其中每个聚类即代表了一个真正不同的任务。采用本发明的方法识别和重命名重复任务可提高后续工作流模型挖掘的精确度。
-
公开(公告)号:CN106095955B
公开(公告)日:2019-04-05
申请号:CN201610424544.X
申请日:2016-06-16
申请人: 杭州电子科技大学
摘要: 本发明公开了一种基于业务流程日志和实体轨迹配对的行为模式挖掘方法。本发明将事件日志数据集转换成实体轨迹数据集,通过使用合成聚类算法来对这些实体轨迹数据集进行分层聚类,得到一个实体轨迹ID向导树,以该向导树为索引,得到包含所有实体轨迹数据集的配对矩阵;然后再通过遍历该配对矩阵将活动名称属性相同的元素划分在一起得到活动块,并根据活动块中的活动名称属性和活动执行者属性组合出现的次数之和、各自出现的次数选择出较频繁的活动块和组合并得到这些频繁的活动块和活动块中频繁的组合之间的结构关系。本发明从协作的角度出发挖掘非结构化业务流程中存在的一些固定行为模式,对于非结构化业务流程的有效分析具有很重要的意义。
-
公开(公告)号:CN107909344A
公开(公告)日:2018-04-13
申请号:CN201711165952.9
申请日:2017-11-21
申请人: 杭州电子科技大学
IPC分类号: G06Q10/10
摘要: 本发明公开了一种基于关系矩阵的工作流日志重复任务识别方法。本发明采用对日志事件先分类再聚类的策略,在划分过程中通过寻找具有稳定结构的循环和并行结构,减少划分种类。在聚类过程中,根据事件上下文计算候选重复任务集合中两两之间相似度,在每次聚类过程中计算模型质量,最终聚类完成后选择最优聚类方案,其中每个聚类即代表了一个真正不同的任务。采用本发明的方法识别和重命名重复任务可提高后续工作流模型挖掘的精确度。
-
公开(公告)号:CN110032494B
公开(公告)日:2020-05-26
申请号:CN201910218832.3
申请日:2019-03-21
申请人: 杭州电子科技大学
IPC分类号: G06F11/30
摘要: 本发明公开了一种基于关联关系的双粒度噪声日志过滤方法。该方法基于局部依赖度和全局依赖度计算得到混合依赖度,通过本发明方法能够同时实现日志中噪声事件的细粒度过滤和噪声轨迹的粗粒度过滤。相比于传统的日志过滤方法,本发明具有如下收益:1、采用了双粒度过滤机制,对于不同的噪声情景使用不同的过滤机制,从而在尽可能保留原始日志数据的情况下实现了优秀的过滤效果;2、使用过滤后的日志文件用于流程挖掘能极大提高流程发现模型的精度,增强了模型的可理解性。
-
-
-
-
-