一种基于知识图谱的暗网话题发现方法和系统
摘要:
本发明公开了一种基于知识图谱的暗网话题发现方法和系统,包括:对获取的暗网数据进行web页面去重,通过算法对存在同一个页面采集了多次的数据进行去重处理;将去重处理后的所述暗网数据进行降维处理;通过黑话词典和文档/段落/句子的向量表示配合词向量表示,对降维后的所述暗网数据进行黑话检测识别;对检测到黑话后的数据进行自然语言处理,提取出弱信号数据的实体、属性、关系和事件;根据自然语言处理提取的弱信号数据构造事实三元组,构建事件知识图谱;在所述事件知识图谱中通过图匹配和遍历实现弱信号数据间的关联发现,并通过所述事件知识图谱中的弱信号关联和节点中心性计算实现核心话题的发现。
公开/授权文献
0/0