-
公开(公告)号:CN104077279B
公开(公告)日:2019-02-05
申请号:CN201310096315.6
申请日:2013-03-25
Applicant: 中兴通讯股份有限公司
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种并行社区发现方法和装置,涉及数据挖掘领域。本发明公开的方法包括:读入原始社交网络数据,将其转换成邻接矩阵的形式并存储在HDFS文件系统上;在配置有Hadoop环境的计算集群上计算存储在HDFS上的图的邻接矩阵的度矩阵D和Laplacian矩阵;对Laplacian矩阵进行特征值和特征向量的并行Lanczos数值求解,得到矩阵前K个最大特征值对应的特征向量,并构造出特征向量矩阵进行归一化,得到规范化的特征向量矩阵并提取特征,将每行看作一个点,采用聚类方法将其聚类成K类;根据点的对应关系,将原来的社区中的个体等价地划为K类,完成社区的分类。本发明还公开了一种社区发现装置。本申请技术方案对于大规模数据具有良好的适应性。
-
公开(公告)号:CN104077723B
公开(公告)日:2018-04-27
申请号:CN201310097930.9
申请日:2013-03-25
Applicant: 中兴通讯股份有限公司
IPC: G06Q50/00
Abstract: 本发明公开了一种社交网络推荐系统及方法,涉及数据挖掘技术领域。本发明公开的系统包括:并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息;用户间链接强度计算模块,基于用户间的交互信息并行计算用户间的链接强度;并行化社区发现模块,根据用户间的链接强度,结合相应的聚类算法,实现并行化的社区发现;基于社区发现结果的潜在信息分析与推荐模块,在社区发现的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。本发明还公开了社交网络推荐方法。本申请技术方案提高了推荐系统的定向性和准确性。
-
公开(公告)号:CN104077279A
公开(公告)日:2014-10-01
申请号:CN201310096315.6
申请日:2013-03-25
Applicant: 中兴通讯股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明公开了一种并行社区发现方法和装置,涉及数据挖掘领域。本发明公开的方法包括:读入原始社交网络数据,将其转换成邻接矩阵的形式并存储在HDFS文件系统上;在配置有Hadoop环境的计算集群上计算存储在HDFS上的图的邻接矩阵的度矩阵D和Laplacian矩阵;对Laplacian矩阵进行特征值和特征向量的并行Lanczos数值求解,得到矩阵前K个最大特征值对应的特征向量,并构造出特征向量矩阵进行归一化,得到规范化的特征向量矩阵并提取特征,将每行看作一个点,采用聚类方法将其聚类成K类;根据点的对应关系,将原来的社区中的个体等价地划为K类,完成社区的分类。本发明还公开了一种社区发现装置。本申请技术方案对于大规模数据具有良好的适应性。
-
公开(公告)号:CN104077723A
公开(公告)日:2014-10-01
申请号:CN201310097930.9
申请日:2013-03-25
Applicant: 中兴通讯股份有限公司
IPC: G06Q50/00
Abstract: 本发明公开了一种社交网络推荐系统及方法,涉及数据挖掘技术领域。本发明公开的系统包括:并行数据获取模块,并行获取必要的社交网络数据,实时获取用户间的交互信息;用户间链接强度计算模块,基于用户间的交互信息并行计算用户间的链接强度;并行化社区发现模块,根据用户间的链接强度,结合相应的聚类算法,实现并行化的社区发现;基于社区发现结果的潜在信息分析与推荐模块,在社区发现的基础上,分析用户潜在的信息,分析特定社区的成因结构特性、关键用户以及分析关键词在社区间的分布特性,对社交网络中的用户,综合其个体信息及所在社区信息进行推荐。本发明还公开了社交网络推荐方法。本申请技术方案提高了推荐系统的定向性和准确性。
-
公开(公告)号:CN104077280A
公开(公告)日:2014-10-01
申请号:CN201310096323.0
申请日:2013-03-25
Applicant: 中兴通讯股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本发明公开了社区发现并行化方法和系统、主节点和运算节点设备,涉及社交网络系统中分析关系系统。本发明公开的方法包括:根据社交网站数据库中用户的交互信息,计算网络中点与点的链接强度;主节点将所有用户随机分为p个大小相等的社区并派给p个运算节点进行融合操作;主节点根据b个社区之间的链接关系,进行融合操作得到k个社区,并计算社区划分结果的模块度;主节点将k个社区合并成为大小相似的p个社区,重新派给p个运算节点进行粗分类以及融合操作,直到k个社区的模块度小于阈值时,得到社区发现的最终结果。本发明还公开了社区发现并行化系统、主节点及运算节点设备。本申请技术方案具有更高的模块度和分类精度。
-
-
-
-