-
公开(公告)号:CN106156150B
公开(公告)日:2019-06-25
申请号:CN201510175964.4
申请日:2015-04-14
Applicant: 北大方正集团有限公司 , 北京大学 , 国家计算机网络与信息安全管理中心 , 北京北大方正电子有限公司
IPC: G06F16/9535 , G06F16/332
Abstract: 本发明公开了一种微博用户关联信息筛选方法及装置,用以解决现有技术中存在的数据稀疏的问题,以及推荐效果不理想,降低系统推荐效率的问题,该方法包括:首先确定当前用户的关联用户集合、特征向量、以及社区结构和主题;根据该每一个关联用户对应的特征向量中的每一个特征项和每一个社区结构对应的主题,得到用户主题分布;根据用户主题分布,筛选出当前用户的目标关联用户,这样,可以避免了推荐结果数据稀疏的问题,提高了系统的推荐效率,并得到与当前用户的兴趣爱好一致的关联用户。
-
公开(公告)号:CN106156150A
公开(公告)日:2016-11-23
申请号:CN201510175964.4
申请日:2015-04-14
Applicant: 北大方正集团有限公司 , 北京大学 , 国家计算机网络与信息安全管理中心 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种微博用户关联信息筛选方法及装置,用以解决现有技术中存在的数据稀疏的问题,以及推荐效果不理想,降低系统推荐效率的问题,该方法包括:首先确定当前用户的关联用户集合、特征向量、以及社区结构和主题;根据该每一个关联用户对应的特征向量中的每一个特征项和每一个社区结构对应的主题,得到用户主题分布;根据用户主题分布,筛选出当前用户的目标关联用户,这样,可以避免了推荐结果数据稀疏的问题,提高了系统的推荐效率,并得到与当前用户的兴趣爱好一致的关联用户。
-
公开(公告)号:CN104572687A
公开(公告)日:2015-04-29
申请号:CN201310488236.X
申请日:2013-10-17
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本发明实施例提供一种微博传播的关键用户识别方法和装置,在微博传播的网络架构中,按照连接节点个数从少到多的顺序执行多次删除操作,每次删除操作将连接节点个数相同的节点从网络架构中删除直至网络架构中剩余连接节点个数相同的至少一个目标节点,最后将目标节点确定为微博传播的关键用户节点。从而提高确定的微博传播的关键用户的准确度。
-
公开(公告)号:CN102567304B
公开(公告)日:2014-02-26
申请号:CN201010621142.1
申请日:2010-12-24
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/27
CPC classification number: G06F17/24 , G06F17/2705 , G06F17/30699 , G06F17/30867
Abstract: 本发明公开了一种网络不良信息的过滤方法以及装置,涉及计算机信息处理及信息过滤技术领域。其中,本发明实施例提供的一种网络不良信息的过滤方法,包括:获取待过滤文本信息、系统预研模型信息以及用户反馈模型信息;对所述待过滤文本信息进行预处理;将所述预处理后的待过滤文本信息与所述系统预研模型信息进行特征信息匹配,给出第一匹配结果;将所述预处理后的待过滤文本信息与所述用户反馈模型信息进行特征信息匹配,给出第二匹配结果;根据所述第一匹配结果与所述第二匹配结果,对所述待过滤文本信息进行过滤处理。采用本发明实施例能够实现提高不良信息自动过滤性能,且可以实现系统信息自动更新。
-
公开(公告)号:CN102567304A
公开(公告)日:2012-07-11
申请号:CN201010621142.1
申请日:2010-12-24
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/27
CPC classification number: G06F17/24 , G06F17/2705 , G06F17/30699 , G06F17/30867
Abstract: 本发明公开了一种网络不良信息的过滤方法以及装置,涉及计算机信息处理及信息过滤技术领域。其中,本发明实施例提供的一种网络不良信息的过滤方法,包括:获取待过滤文本信息、系统预研模型信息以及用户反馈模型信息;对所述待过滤文本信息进行预处理;将所述预处理后的待过滤文本信息与所述系统预研模型信息进行特征信息匹配,给出第一匹配结果;将所述预处理后的待过滤文本信息与所述用户反馈模型信息进行特征信息匹配,给出第二匹配结果;根据所述第一匹配结果与所述第二匹配结果,对所述待过滤文本信息进行过滤处理。采用本发明实施例能够实现提高不良信息自动过滤性能,且可以实现系统信息自动更新。
-
公开(公告)号:CN103207860B
公开(公告)日:2017-08-25
申请号:CN201210007694.2
申请日:2012-01-11
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种舆情事件的实体关系抽取方法,包括:对舆情事件的文本集合进行分词;从分词得到的切分单元中抽取主题短语;基于聚类方法从主题短语中获取子主题;从子主题中获取实体关系。本发明还提供了一种舆情事件的实体关系抽取装置,包括:分词模块,用于对舆情事件的文本集合进行分词;主题短语模块,用于从分词得到的切分单元中抽取主题短语;子主题模块,用于基于聚类方法从主题短语中获取子主题;实体关系模块,用于从子主题中获取实体关系。本发明提高了抽取舆情事件的实体关系的性能。
-
公开(公告)号:CN103136274A
公开(公告)日:2013-06-05
申请号:CN201110396422.1
申请日:2011-12-02
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种用于内容资源数据库的日期检索方法,包括:将待检索日期范围与内容资源数据库的多个日期索引子库的日期范围进行相交运算;对交集非空的多个日期索引子库检索待检索日期范围;将检索到的记录提交给用户。本发明提供了一种用于内容资源数据库的日期检索装置,包括:运算模块,用于将待检索日期范围与内容资源数据库的多个日期索引子库的日期范围进行相交运算;检索模块,用于对交集非空的多个日期索引子库检索待检索日期范围;提交模块,用于将检索到的记录提交给用户。本发明缩短了对内容资源数据库的日期检索的时间。
-
公开(公告)号:CN106156192A
公开(公告)日:2016-11-23
申请号:CN201510191694.6
申请日:2015-04-21
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
Abstract: 本发明提出了一种舆情数据聚类方法和一种舆情数据聚类系统,其中,所述舆情数据聚类方法包括:对社交网络中的当前数据进行冗余过滤,以获取非冗余数据;对所述非冗余数据进行分析,以在所述非冗余数据中确定相关舆情数据;对所述相关舆情数据进行聚类,以在所述相关舆情数据中确定目标舆情数据。通过本发明的技术方案,通过对社交网站中的海量数据进行增量式的聚类,不仅可以使聚类的处理速度可以达到实时性的要求,还可以调整聚类结果,从而避免了聚类出局部片断式的聚类结果,进而提高了聚类结果的准确性。
-
公开(公告)号:CN104572687B
公开(公告)日:2018-07-31
申请号:CN201310488236.X
申请日:2013-10-17
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供种微博传播的关键用户识别方法和装置,在微博传播的网络架构中,按照连接节点个数从少到多的顺序执行多次删除操作,每次删除操作将连接节点个数相同的节点从网络架构中删除直至网络架构中剩余连接节点个数相同的至少个目标节点,最后将目标节点确定为微博传播的关键用户节点。从而提高确定的微博传播的关键用户的准确度。
-
公开(公告)号:CN103914494B
公开(公告)日:2017-05-17
申请号:CN201310008156.X
申请日:2013-01-09
Applicant: 北大方正集团有限公司 , 北京大学 , 北京北大方正电子有限公司
CPC classification number: G06F17/3053 , G06F17/30598 , G06F21/316
Abstract: 本发明提供一种微博用户身份识别方法及系统,所述方法包括:获取待识别用户行为数据以及用户行为的特征库信息;预处理所述获取的待识别用户行为数据;将所述预处理后的用户行为数据,进行语义单元重构;获取所述语义单元的属性信息以及其对应的权重;根据所述语义单元的属性信息以及其对应的权重,获取所述待识别用户行为特征;将所述待识别用户行为特征与用户行为的特征库信息中的每个特征类型进行比较;当所述待识别用户行为特征与所述用户行为的特征库信息中的一个特征类型的相似度超过预设阈值,则所述待识别用户身份确定。采用本发明提供的微博用户身份识别方法及系统可以有效提高微薄用户身份识别的准确性及实时性。
-
-
-
-
-
-
-
-
-