-
公开(公告)号:CN103150382B
公开(公告)日:2015-04-01
申请号:CN201310081984.6
申请日:2013-03-14
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于开放知识库的短文本语义概念自动化扩展方法,所述方法将每条短文本生成的n-gram集合中的每个元素链接到开放知识库中与该元素最相关的概念,并且基于开放知识库的概念关系矩阵和所链接的概念,为该元素生成扩展的语义概念集合。该方法仅采用开放知识库文档中的锚文本信息而不采用文档的词项信息和目录信息来构建概念关系矩阵,这使得该矩阵的构造和计算方便,而且克服了目录信息粒度比较粗,歧义多的问题。而且在语义概念扩展阶段,采用基于上下文的语义相似度计算方法来进行语义概念扩展,同时考虑了短文本内容的上下文内容的一致性和概念在抽象语义层的相似性,提高了语义概念扩展的准确性。
-
公开(公告)号:CN103150678B
公开(公告)日:2014-12-10
申请号:CN201310077524.6
申请日:2013-03-12
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种微博中用户间潜在关注关系的发现方法,包括:根据用户集和用户间关注关系集构建用户关注关系矩阵;计算用户关注关系矩阵的两个非负分解矩阵;根据两个非负矩阵的乘积以及用户关注关系矩阵得到潜在关注关系矩阵。本发明结合了微博中用户间的关注关系和用户间交互行为信息来发现潜在关注关系,能够减少发现用户间潜在关注关系的结果误差。
-
公开(公告)号:CN103823879A
公开(公告)日:2014-05-28
申请号:CN201410072608.5
申请日:2014-02-28
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30345 , G06F17/30634
Abstract: 本发明提供一种面向在线百科的知识库自动更新的方法,该方法实时监控知识库的知识语料来源,根据知识语料更新时间和知识语料内容变化,获取新增的知识语料与内容改变的知识语料;从所获取的知识语料识别知识的变化,以及将基于所识别的知识的变化来更新知识库。该方法实时感知更新的知识,自动判断更新知识在知识库中所处的位置,以及将更新的知识,自动合并添加到知识库中,可避免知识库的滞后性并满足用户对知识库时新性的要求。
-
公开(公告)号:CN102426610B
公开(公告)日:2014-05-07
申请号:CN201210010315.5
申请日:2012-01-13
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种微博排名方法,该方法首先计算消息的实时性权值和消息作者影响力权值,然后将二者的加权平均值作为该消息的排名值,并基于所计算的排名值对消息进行排序。该方法通过将微博作者权威性和消息实时性相结合来进行排名,提高了当前微博检索结果的精确度。而且计算微博作者的影响力计算的方法简单高效,还适用于对微博系统中得用户进行权威性或者影响力排名。
-
公开(公告)号:CN103745105A
公开(公告)日:2014-04-23
申请号:CN201410005723.0
申请日:2014-01-06
Applicant: 中国科学院计算技术研究所
IPC: G06F19/00
Abstract: 本发明提供一种社交网络中用户属性的预测方法及系统,所述方法包括:统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;以及根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。在地理位置社交网络数据集上的实验数据表明,本发明提供的社交网络中用户属性的预测方法及系统可提高用户属性预测的准确性。
-
公开(公告)号:CN103631949A
公开(公告)日:2014-03-12
申请号:CN201310674521.0
申请日:2013-12-11
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F17/30964
Abstract: 本发明提供一种社交网络数据采集方法和系统,所述方法包括根据用户资料和用户过去一段时间的数据更新信息,将该用户归于预先设定的多个用户组中的一个,得到该用户组的数据更新分布向量。其中,每个用户组中用户的用户资料和数据更新信息相似,用户组的数据更新分布向量体现该用户组中所有用户在一个时间区间内所有时间片段的数据更新行为。所述方法还包括根据所述用户组的数据更新分布向量,制定该用户在一个时间区间内不同时间片段的数据采集策略。本发明可针对不同的用户制定不同的实时数据采集策略,提高了社交网络数据采集的实时性和效率。
-
公开(公告)号:CN103354554A
公开(公告)日:2013-10-16
申请号:CN201310204527.1
申请日:2013-05-28
Applicant: 中国科学院计算技术研究所
IPC: H04L29/08
Abstract: 本发明提供一种用于eMule网络的文件资源信息采集方法,包括下列步骤:1)初始化文件集合;2)遍历所述文件集合,对于每个文件,搜索共享过该文件的活跃客户端的地址信息,得到活跃客户端集合;3)对于活跃客户端集合中的每个活跃客户端,探测该活跃客户端所共享的文件列表;4)根据所探测的活跃客户端所共享的文件列表,更新所述文件集合,返回执行步骤2);重复执行所述步骤2)~4),得到文件索引表,该文件索引表中记录出现在所述文件集合中的每个文件及其对应的活跃客户端地址信息。本发明能够全面获取eMule网络上所有文件的索引;能够获得eMule网络中各个文件资源的活跃度信息,从而为进一步的监控提供依据。
-
公开(公告)号:CN103324662A
公开(公告)日:2013-09-25
申请号:CN201310134433.1
申请日:2013-04-18
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种社会媒体事件的动态观点演变的可视化方法,该方法首先确定所采集的社会媒体事件信息集合中信息的情感隶属度和情感分类,然后基于所述信息的情感分类,建立情感可视化图形的几何布局并基于所述信息的情感隶属度对所建立的几何布局进行着色。该方法可以直观的显示信息流中事件的情感变化,在事件的变化和发展方面可以显示更多的情感信息,能够帮助用户更好的识别事件的转折点和爆发点,预测事件的发展趋势。
-
公开(公告)号:CN103198149A
公开(公告)日:2013-07-10
申请号:CN201310142075.9
申请日:2013-04-23
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种查询纠错方法和系统。所述方法包括:将查询语句转换为字符序列,判断字符序列的长度是否大于预定阈值δ;对长度大于δ的字符序列同时进行正向和反向查询纠错处理,直到重合处理的字符个数达到阈值M,得到正向和反向的候选语句项集合。所述方法还包括将正向的候选语句项集合中后M个字符与反向候选语句项集合中前M个字符相同的候选语句项进行拼接,拼接后的候选语句项构成纠错候选项集合。所述方法支持中、英文混杂的查询语句,并且可对长查询采用正反向并行的查询纠错处理,这种并行的处理方式在保证正确率的同时节省了查询纠错的处理时间。
-
公开(公告)号:CN102662986A
公开(公告)日:2012-09-12
申请号:CN201210065804.0
申请日:2012-01-13
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种微博检索方法,该系统定期获取最新发布的微博消息,计算每条消息的摘要,并且提取该摘要中的词语间的关联关系,将其保存到词关系数据库中。在收到检索用户的查询词后,将与该查询词存在关联关系的多个词作为推荐词列表返回给检索用户,检索用户通过在推荐词和查询词之间建立逻辑关系来构建话题,以及将所构建的话题作为检索条件,将符合该检索条件的微博消息返回给检索用户。该系统基于由多个词构成的话题来进行检索,能够改善检索效果,提高用户体验。而且,通过利用微博用户的爱好与属性,提供一种基于人的信息查询手段,能够在最大程度上向检索用户提供其所关心的话题消息数据。
-
-
-
-
-
-
-
-
-