基于Spark的大规模图数据的多样性图排序方法

    公开(公告)号:CN106372127B

    公开(公告)日:2019-05-03

    申请号:CN201610715105.4

    申请日:2016-08-24

    申请人: 云南大学

    IPC分类号: G06F16/2457 G06F16/2458

    摘要: 本发明公开了一种基于Spark的大规模图数据的多样性图排序方法,以大规模图数据的多样性图排序为目标,以图数据中结点间距离度量方法为基础,结合经典的个性化PageRank算法和基于距离的多样化度量方法进行图数据多样性图排序,具有可扩展性、更为高效等优点,且满足了海量图数据多样性图排序的数据存储和计算的要求,为海量图数据分析处理和挖掘等亟待解决的关键问题提供了有力的技术支持。

    基于Spark的大规模图数据的多样性图排序方法

    公开(公告)号:CN106372127A

    公开(公告)日:2017-02-01

    申请号:CN201610715105.4

    申请日:2016-08-24

    申请人: 云南大学

    IPC分类号: G06F17/30

    CPC分类号: G06F17/3053 G06F17/30539

    摘要: 本发明公开了一种基于Spark的大规模图数据的多样性图排序方法,以大规模图数据的多样性图排序为目标,以图数据中结点间距离度量方法为基础,结合经典的个性化PageRank算法和基于距离的多样化度量方法进行图数据多样性图排序,具有可扩展性、更为高效等优点,且满足了海量图数据多样性图排序的数据存储和计算的要求,为海量图数据分析处理和挖掘等亟待解决的关键问题提供了有力的技术支持。

    基于隐变量模型的用户偏好提取方法

    公开(公告)号:CN105205184A

    公开(公告)日:2015-12-30

    申请号:CN201510719818.3

    申请日:2015-10-30

    申请人: 云南大学

    IPC分类号: G06F17/30

    CPC分类号: G06F16/903

    摘要: 本发明公开了一种基于隐变量模型的用户偏好提取方法,首先选取N个商品相关属性构成商品属性集合,根据历史数据构建得到贝叶斯网络,对贝叶斯网络搜索得到最大半团,然后向该最大半团中插入表示用户偏好的隐变量L得到隐变量模型,L=1表示用户喜好,L=0表示用户不喜好;对隐变量模型进行参数学习,得到隐变量模型中各个节点的条件概率表;然后根据隐变量L的条件概率表,进行用户偏好提取:查找得到L=1时,条件概率最大值对应的属性组合项,该项对应用户最喜好的商品类型;查找得到L=0时,条件概率最大值对应的属性组合项,该项对应用户最不喜好的商品类型。本发明针对商品评价数据中隐含的用户偏好,通过贝叶斯网络结构来提取更客观、更符合实际的用户偏好结果。