- 专利标题: 一种基于知识图谱的暗网话题发现方法和系统
-
申请号: CN201910305756.X申请日: 2019-04-16
-
公开(公告)号: CN110046260B公开(公告)日: 2021-06-08
- 发明人: 谭庆丰 , 陈小龙 , 谭润楠 , 张宇 , 顾钊铨 , 田志宏 , 殷丽华
- 申请人: 广州大学
- 申请人地址: 广东省广州市番禺广州大学城外环西路230号
- 专利权人: 广州大学
- 当前专利权人: 广州大学
- 当前专利权人地址: 广东省广州市番禺广州大学城外环西路230号
- 代理机构: 广州三环专利商标代理有限公司
- 代理商 颜希文; 麦小婵
- 主分类号: G06F16/36
- IPC分类号: G06F16/36 ; G06K9/62
摘要:
本发明公开了一种基于知识图谱的暗网话题发现方法和系统,包括:对获取的暗网数据进行web页面去重,通过算法对存在同一个页面采集了多次的数据进行去重处理;将去重处理后的所述暗网数据进行降维处理;通过黑话词典和文档/段落/句子的向量表示配合词向量表示,对降维后的所述暗网数据进行黑话检测识别;对检测到黑话后的数据进行自然语言处理,提取出弱信号数据的实体、属性、关系和事件;根据自然语言处理提取的弱信号数据构造事实三元组,构建事件知识图谱;在所述事件知识图谱中通过图匹配和遍历实现弱信号数据间的关联发现,并通过所述事件知识图谱中的弱信号关联和节点中心性计算实现核心话题的发现。
公开/授权文献
- CN110046260A 一种基于知识图谱的暗网话题发现方法和系统 公开/授权日:2019-07-23