-
公开(公告)号:CN103823868A
公开(公告)日:2014-05-28
申请号:CN201410066711.9
申请日:2014-02-26
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30616 , G06F17/30707
Abstract: 本发明提供一种面向在线百科的事件识别方法和事件关系抽取方法。所述事件识别方法包括:从在线百科的分类体系中得到事件类分类标签;所述事件类分类标签表示该分类标签下的词条与一个或多个事件有关。以及对于所述在线百科中的词条,根据其所有分类标签中属于所述事件类分类标签的分类标签所占比率,判断所述词条是否是事件类词条。本发明能够快速且准确地识别出事件类词条,并且能够在事件识别的基础上进行事件关系的抽取,适用于对事件进行预测和溯源。
-
公开(公告)号:CN103605789A
公开(公告)日:2014-02-26
申请号:CN201310645868.2
申请日:2013-12-04
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本发明提供一种获取KAD网络上热门检索资源的方法及系统。所述方法包括:构造模拟节点并加入KAD网络,使得所述模拟节点在KAD网络空间中均匀分布;由所述模拟节点监听所述KAD网路中其他节点的请求消息。所述方法还包括由所述模拟节点将从资源检索请求消息中获取的资源ID发送至热门资源统计服务器进行统计。本发明能够比较全面、准确地获得KAD网络中的热门检索资源,能够为网络信息挖掘及网络信息安全等工作提供帮助。
-
公开(公告)号:CN103279479A
公开(公告)日:2013-09-04
申请号:CN201310138895.0
申请日:2013-04-19
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种面向微博客平台文本流的突发话题检测方法及系统,其中方法包括:步骤1,实时采集微博客平台的用户数据及用户生成消息数据,并提取出消息文本及配图;步骤2,设定时间窗口对所述消息文本进行划分,获得实时数据流和历史数据;步骤3,选取特征,进行流行度评估模型和长微博提取模型的训练;步骤4,对所述实时数据流利用所述流行度评估模型进行流行度评估,利用所述长微博提取模型进行长微博提取,并分别放入流行消息集合和长微博集合;步骤5,判断所述流行消息集合与所述长微博集合数量是否均达到预设的阈值,若达到,使用LDA模型或加权求和的方式进行话题提取对两个集合的数据提取突发话题,否则返回步骤1。
-
公开(公告)号:CN103268348A
公开(公告)日:2013-08-28
申请号:CN201310204529.0
申请日:2013-05-28
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供了一种用户查询意图识别方法,包括:1)对于待识别的用户查询,将其切分为两个命名实体e1,e2和命名实体上下文ct;2)根据用户查询日志的集合和主题模型,计算用户查询中包含命名实体e1,e2和上下文ct的情况下隐含主题r的概率p(r|e1,e2,ct),找出使得概率p(r|e1,e2,ct)最大的主题r,将该主题r作为命名实体e1,e2之间所隐含的关系;所述主题模型是用查询日志聚合文档集合训练得到的主题模型;所述查询日志聚合文档集合是将每两个命名实体在查询日志中的上下文聚合到一起,形成的关于两两命名实体组合的文档集合。本发明识别的准确率和召回率高;时间复杂度低,给搜索引擎造成的负荷较小,能够提升用户体验;特别适合于移动端的搜素或者移动终端本地的应用搜索。
-
公开(公告)号:CN103258052A
公开(公告)日:2013-08-21
申请号:CN201310204314.9
申请日:2013-05-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种eMule网络上关联资源的发现方法,包括下列步骤:1)获取用户设置的初始的关键词列表;2)对于当前关键词列表中的每个关键词,在eMule网络中搜索与该关键词相关的资源文件,并记录搜索到的资源文件信息;3)对进行了记录的资源文件的文件名进行分词处理,并将分词得到的新词加入关键词列表中,然后重新执行步骤2);重复执行步骤2)至3)直到满足结束条件。本发明能够全面地发现eMule网络中潜在的用户感兴趣的资源,还能够帮助用户发现特定领域相关的潜在的用户感兴趣的资源。
-
公开(公告)号:CN103198432A
公开(公告)日:2013-07-10
申请号:CN201310127459.3
申请日:2013-04-12
Applicant: 中国科学院计算技术研究所
IPC: G06Q50/00
Abstract: 本发明提供一种在线社会网络中网络群体的检测方法,所采集的节点集中随机选择一个节点,从所选节点的邻居节点中选择未与所选节点建立群关系的且收益最大的邻居节点并在该邻居节点与所选节点之间建立群关系;对所选节点进行策略更新,并重新计算由于所选节点的策略更新所影响到的所有节点的收益;不断上述步骤,直到所述节点集中没有收益可改进的节点时,输出节点集中互相之间存在群关系的所有节点作为所检测的网络群体。该方法结合在线社会网络中节点的信息交互行为和节点间的社会关系,可以在在线社会关系网络中发现具有动态特性和行为因素影响的网络群体。
-
公开(公告)号:CN103150678A
公开(公告)日:2013-06-12
申请号:CN201310077524.6
申请日:2013-03-12
Applicant: 中国科学院计算技术研究所
IPC: G06Q50/00
Abstract: 本发明提供一种微博中用户间潜在关注关系的发现方法,包括:根据用户集和用户间关注关系集构建用户关注关系矩阵;计算用户关注关系矩阵的两个非负分解矩阵;根据两个非负矩阵的乘积以及用户关注关系矩阵得到潜在关注关系矩阵。本发明结合了微博中用户间的关注关系和用户间交互行为信息来发现潜在关注关系,能够减少发现用户间潜在关注关系的结果误差。
-
公开(公告)号:CN101944167A
公开(公告)日:2011-01-12
申请号:CN201010297048.5
申请日:2010-09-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明一种识别恶意程序的方法和系统,方法包括:步骤1,获取计算机系统中所有进程的信息和进程行为,根据进程之间的父子关系建立进程关系树,对应每个进程保存进程的信息和进程行为的列表;步骤2,将父进程的进程行为列表中的进程行为分类,按进程关系树从上到下的顺序,依据分类将父进程信息分配到子进程;步骤3,按进程关系树和进程信息进行符号化,依据预设的恶意行为阈值判断出恶意程序,将恶意程序在计算机系统中运行,得到用于判断恶意程序的专家系统;步骤4,当新程序进程产生时,利用专家系统判断新程序是否为恶意程序。本发明的实现复杂度相对于现有技术较低,能够提高效率。
-
公开(公告)号:CN116049381A
公开(公告)日:2023-05-02
申请号:CN202211667430.X
申请日:2022-12-23
Applicant: 中国科学院计算技术研究所
IPC: G06F16/34 , G06F16/36 , G06F16/35 , G06F16/2455 , G06F16/2458 , G06N3/044 , G06N3/0442 , G06N3/045 , G06N3/084 , G06N5/04
Abstract: 本发明提出一种基于知识图谱的特定目标可视化分析方法和系统,包括:获取来自多个数据源包括实体数据和动态事件数据的基础数据库,采用流式文本单遍聚类方法对该基础数据库中各数据源的话题进行分类,并对各数据源的关键信息、实体及实体间关系信息进行提取,融合各数据源的提取结果构建知识图谱;以待分析的特定目标检索该知识图谱,得到该特定目标的目标实体和关联事件;对该目标实体进行人员分析和组织分析,形成该目标实体的实体画像;以节点和边形式展示该目标实体与其关联实体之间或该目标实体与该关联事件的关联关系。本发明提供了多领域数据综合分析的能力,提供时序线索推理、隐含线索推理功能,可以挖掘出数据库中并不存在的线索数据。
-
公开(公告)号:CN104636466B
公开(公告)日:2020-07-31
申请号:CN201510071993.6
申请日:2015-02-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种面向开放网页的实体属性抽取方法和系统。其中,所述方法包括:提取开放网页的文本,从中获得目标实体的候选文本集合;以及,根据目标实体属性在训练文本集合中出现的频率,选择基于规则的方式或者基于统计的方式从所述候选文本集合中抽取目标实体属性的值。本发明能够提高开放网页实体属性抽取的准确率和召回率,并且不依赖于网页结构,能够适应开放网页类型的变化。
-
-
-
-
-
-
-
-
-