一种基于众包的空间检索词查询的评价方法和装置

    公开(公告)号:CN107609126B

    公开(公告)日:2019-03-29

    申请号:CN201710833269.1

    申请日:2017-09-15

    摘要: 本发明公开了一种基于众包的空间检索词查询的评价方法,包括:根据第一排序算法获取针对查询条件的第一排序列表,根据第二排序算法获取针对所述查询条件的第二排序列表;获取第一排序列表和第二排序列表的元素集合,将元素集合中的任意两个元素进行配对得到多个元素对;将每个所述的元素对转化成二进制问题并发布到众包平台;采集众包平台中二进制问题的答案,基于该答案获取基于众包平台的数据的第三排序列表;比较第一排序列表与第三排序列表之间的相似性、以及第二排序列表与第三排序列表之间的相似性,根据比较结果评价第一排序算法与第二排序算法的优劣。该方法能够判断出排序函数的优劣,从而帮助选择具有较好检索结果的排序函数。

    待估节点的数据填补方法和装置

    公开(公告)号:CN105142164A

    公开(公告)日:2015-12-09

    申请号:CN201510355716.8

    申请日:2015-06-24

    IPC分类号: H04W24/02 H04W24/04

    CPC分类号: H04W24/02 H04W24/04 H04W84/18

    摘要: 本发明提供一种待估节点的数据填补方法和装置,该方法包括:通过选择与缺失数据时空相关性较高的数据集合作为基础数据样本集合,并根据该基础数据样本集合中的待估节点在当前待估时刻之前的所有时刻的数据变化规律,以及,与待估节点空间相关性较高的节点在当前待估时刻的数据变化规律,为缺失数据确定评估数据,并将该评估数据填补至数据集合中。通过本发明提供的待估节点的数据填补方法,可以对无线传感器网络的管理节点存储的数据集合中的缺失数据进行填补,使用户可以根据数据集合中的数据进行分析,并得到正确的分析结果。

    一种隐式标签同现的预测方法及装置

    公开(公告)号:CN108874868A

    公开(公告)日:2018-11-23

    申请号:CN201810374955.1

    申请日:2018-04-24

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种隐式标签同现的预测方法,包括:获取信息网络中与标签相关的实体,基于不同实体之间的关系构建权重网络元结构并得到信息网络对应的网络拓扑结构;分别针对不同的实体,相应计算得到不同实体的权重并添加到所述网络拓扑结构中;针对待预测的两个标签,在所述网络拓扑结构中获取两个标签之间的权重路径;其中,所述权重路径为待预测的两个标签之间连接路径;将所述权重路径作为输入,采用逻辑回归模型作为预测模型,计算待预测的两个标签同现的概率。本申请能够对标签网络中隐藏更深的标签关系是否能够同现进行准确预测,进而挖掘得到更深层次的相关信息。

    分布式数据的一致性维护系统和方法

    公开(公告)号:CN103036717B

    公开(公告)日:2015-11-04

    申请号:CN201210535376.3

    申请日:2012-12-12

    IPC分类号: H04L12/24 H04L29/08

    摘要: 一种分布式集群系统中分布式数据的一致性维护系统和方法,由集群管理节点、全局锁管理节点和多个分散位于系统中的数据维护节点组成该系统,其中,数据维护节点都是存储一个或多个数据副本的同构节点,设有事件监听、数据一致性维护和事件发送三个模块。全局锁管理节点负责存储和管理系统中所有数据的更新锁和存储所有数据维护节点信息,设有消息接收和发送模块、更新锁请求队列、数据维护节点信息管理模块三个部件。集群管理节点负责管理系统中所有节点最新信息,并负责周期检测系统中每个节点的状态。本发明方法工作可靠和灵活,客户端可对多个目标数据同时发起数据更新。且在数据更新过程中,操作简便,通信开销少,更新时延短,应用前景看好。

    一种基于非累积属性的实时欺诈检测方法及装置

    公开(公告)号:CN105930430B

    公开(公告)日:2020-01-07

    申请号:CN201610245288.8

    申请日:2016-04-19

    IPC分类号: G06F16/2458

    摘要: 本发明提供了一种基于非累积属性的实时欺诈检测方法及装置,用于电信信息安全技术领域。本发明装置包括属性设计模块、用户分箱模块、用户离散化模块、评分计算模块以及欺诈判决模块;属性设计模块中选择非累积的属性表征用户的通话习惯,用户分箱模块采用等深分箱,获取被检测用户在每个属性上的离散化结果,评分计算模块计算用户间的曼哈顿距离的最小值,欺诈判决模块根据阈值判断是否发生欺诈。本发明方法用非累积的属性刻画用户的行为特征,根据其通话习惯的相似性进行欺诈识别,采用等深分箱避免高值用户对正态分布偏度的影响,使用曼哈顿距离进行评分计算。本发明计算复杂度低,实现了海量数据实时运算,可在欺诈早期进行识别告警。

    一种基于众包的空间检索词查询的评价方法和装置

    公开(公告)号:CN107609126A

    公开(公告)日:2018-01-19

    申请号:CN201710833269.1

    申请日:2017-09-15

    IPC分类号: G06F17/30 G06Q50/00

    摘要: 本发明公开了一种基于众包的空间检索词查询的评价方法,包括:根据第一排序算法获取针对查询条件的第一排序列表,根据第二排序算法获取针对所述查询条件的第二排序列表;获取第一排序列表和第二排序列表的元素集合,将元素集合中的任意两个元素进行配对得到多个元素对;将每个所述的元素对转化成二进制问题并发布到众包平台;采集众包平台中二进制问题的答案,基于该答案获取基于众包平台的数据的第三排序列表;比较第一排序列表与第三排序列表之间的相似性、以及第二排序列表与第三排序列表之间的相似性,根据比较结果评价第一排序算法与第二排序算法的优劣。该方法能够判断出排序函数的优劣,从而帮助选择具有较好检索结果的排序函数。

    一种数据离散化方法及系统

    公开(公告)号:CN106055669A

    公开(公告)日:2016-10-26

    申请号:CN201610391085.X

    申请日:2016-06-03

    发明人: 牛琨 高志鹏

    IPC分类号: G06F17/30

    CPC分类号: G06F16/2462

    摘要: 本发明实施例提供了一种数据离散化方法及系统,方法包括:获得目标业务的业务数据,并确定业务数据的取值范围,其中取值范围对应有第一最大值和第一最小值;分别对第一最大值和第一最小值取自然对数,以得到第一最大值所对应的第二最大值和第一最小值所对应的第二最小值;对第二最大值和第二最小值所确定的区域进行K段等宽分段,并获取各个分段点所对应的第二临界值;对各个分段所对应的第二临界值取自然指数,以得到第二临界值所对应的第一临界值;利用第一临界值对取值范围进行分段,以得到目标分段区间;获得处于目标分段区间内的目标业务数据。应用本发明实施例,在降低数据离散化处理的计算强度的同时,提高所建模型的精度。

    一种面向高维度大数据的子空间聚类方法及装置

    公开(公告)号:CN106909942B

    公开(公告)日:2022-09-13

    申请号:CN201710112771.3

    申请日:2017-02-28

    IPC分类号: G06K9/62 G06F16/28

    摘要: 本发明实施例提供了一种面向高维度大数据的子空间聚类方法及装置,其中,方法包括:针对获取的高维大数据的每行建立第一Map任务,并按照维度对每个第一Map任务中的数据进行分割,得到每个第一Map任务中每个维度的特征值;在第一Reduce节点中,获取并根据每个维度所有特征值的数据区域、预设窗口数、预设窗口合并阈值及预设窗口密度阈值,得到每个维度的1维密集子空间;根据每两个k维密集子空间,确定k+1维候选子空间;针对每个k维密集子空间建立第二Map任务,并获得分布于每个k维密集子空间的所有样本点;在第二Reduce节点中,得到聚类后的k+1维密集子空间。通过本方案可以提升高维度大数据聚类的运行效率。

    待估节点的数据填补方法和装置

    公开(公告)号:CN105142164B

    公开(公告)日:2018-10-30

    申请号:CN201510355716.8

    申请日:2015-06-24

    IPC分类号: H04W24/02 H04W24/04

    摘要: 本发明提供一种待估节点的数据填补方法和装置,该方法包括:通过选择与缺失数据时空相关性较高的数据集合作为基础数据样本集合,并根据该基础数据样本集合中的待估节点在当前待估时刻之前的所有时刻的数据变化规律,以及,与待估节点空间相关性较高的节点在当前待估时刻的数据变化规律,为缺失数据确定评估数据,并将该评估数据填补至数据集合中。通过本发明提供的待估节点的数据填补方法,可以对无线传感器网络的管理节点存储的数据集合中的缺失数据进行填补,使用户可以根据数据集合中的数据进行分析,并得到正确的分析结果。

    一种面向高维度大数据的子空间聚类方法及装置

    公开(公告)号:CN106909942A

    公开(公告)日:2017-06-30

    申请号:CN201710112771.3

    申请日:2017-02-28

    IPC分类号: G06K9/62 G06F17/30

    CPC分类号: G06K9/6218 G06F17/30598

    摘要: 本发明实施例提供了一种面向高维度大数据的子空间聚类方法及装置,其中,方法包括:针对获取的高维大数据的每行建立第一Map任务,并按照维度对每个第一Map任务中的数据进行分割,得到每个第一Map任务中每个维度的特征值;在第一Reduce节点中,获取并根据每个维度所有特征值的数据区域、预设窗口数、预设窗口合并阈值及预设窗口密度阈值,得到每个维度的1维密集子空间;根据每两个k维密集子空间,确定k+1维候选子空间;针对每个k维密集子空间建立第二Map任务,并获得分布于每个k维密集子空间的所有样本点;在第二Reduce节点中,得到聚类后的k+1维密集子空间。通过本方案可以提升高维度大数据聚类的运行效率。