- 专利标题: 多核环境下基于海量日志的类似行为模式用户识别方法
- 专利标题(英): Method for identifying similar behavior mode users in multicore environment based on massive logs
-
申请号: CN201110242122.8申请日: 2011-08-23
-
公开(公告)号: CN102314491B公开(公告)日: 2013-03-13
- 发明人: 俞东进 , 李万清 , 郑苏杭
- 申请人: 杭州电子科技大学
- 申请人地址: 浙江省杭州市下沙高教园区2号大街
- 专利权人: 杭州电子科技大学
- 当前专利权人: 海宁鼎丞智能设备有限公司
- 当前专利权人地址: 浙江省杭州市下沙高教园区2号大街
- 代理机构: 杭州求是专利事务所有限公司
- 代理商 杜军
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明公开了一种多核环境下基于海量日志的类似行为模式用户识别方法。现有的方法运算量巨大、I/O操作繁重。本发明方法首先在WEB服务器端设置单独的日志数据库,用于存放记录用户访问信息的日志数据集;其次读入日志数据集中的部分日志信息至内置多核CPU的通用计算机内存;根据多核环境下设置的线程个数,均分日志数据集,得到多个局部日志数据集,作为各线程的处理数据源;然后各线程分别搜索局部日志数据集,获取局部类似行为模式,并进行归约;最后并行归并各线程获得的局部类似行为模式集至全局类似行为模式集,获得具有类似行为模式的用户。本发明可使类似访问模式的识别过程具有较高的运行效率和加速比。
公开/授权文献
- CN102314491A 多核环境下基于海量日志的类似行为模式用户识别方法 公开/授权日:2012-01-11