基于生成对抗网络的图数据类别不平衡分类方法及装置

    公开(公告)号:CN115661550A

    公开(公告)日:2023-01-31

    申请号:CN202211461517.1

    申请日:2022-11-17

    Abstract: 本发明公开了基于生成对抗网络的图数据类别不平衡分类方法及装置,通过构建生成器,将属性图信息输入到生成器中,生成器包括低阶神经网络和高阶神经网络,学习图的局部和全局信息,学习并得到节点的嵌入表示向量;再对少样本图数据进行过采样,根据合成少数类过采样技术SMOTE原则,对学习到的每个少数类表示向量进行近邻计算,选择其最近邻节点进行插值计算,生成新的节点;然后重建平衡图数据,通过已有图的节点和边信息训练边生成器,对生成的节点进行链路预测;最后将重建的平衡图数据作为判别器的输入,进行节点分类。有效解决了数据不平衡的假阳性问题,提高了图的节点分类准确率。

    一种面向图数据的批量流式边点混合切分方法

    公开(公告)号:CN115344607A

    公开(公告)日:2022-11-15

    申请号:CN202210933381.3

    申请日:2022-08-04

    Abstract: 本发明属于图数据挖掘领域,公开了一种面向图数据的批量流式边点混合切分方法,设计了一种基于点流数据的批量划分策略,提出了一种优化负载和通讯代价的目标函数,通过计算目标函数确定批量流数据的初始点切分。同时,本方法通过计算现有切分和将流数据节点的分身节点加入到次有切分后的切分增益,决定是否保留分身。除此之外,本发明既解决了点划分的信息丢失,又避免了边切分的信息冗余,在进行点切分和边切分时,都可以并行处理。

    一种多元异步时序数据分类方法和装置

    公开(公告)号:CN115329166A

    公开(公告)日:2022-11-11

    申请号:CN202210851507.2

    申请日:2022-07-19

    Abstract: 本发明公开了一种多元异步时序数据分类方法,提出了一种新颖的时间感知双注意力和记忆增强网络,通过将注意和记忆结合起来,有效地模拟不规则、异步、稀疏采样的多元异步时间序列数据中复杂的相互作用,并设计了随机生成插补模块,构建一个双任务学习体系,实现缺失值插补和分类网络的协同统一。本发明在对异步时序数据缺失值插补和分类的过程中,能够有效挖掘数据隐含的相关性,挖掘有意义的潜在语义,并充分利用序列数据中的辅助信息,从未标记的数据中发现有意义的模式。同时考虑异步时序数据缺失值插补和分类两个任务之间的相互作用,有助于缓解误差传播问题,捕捉相互影响,提高模型的准确性。

    一种基于生成式对抗主动学习的离群点检测方法

    公开(公告)号:CN115146708A

    公开(公告)日:2022-10-04

    申请号:CN202210641407.7

    申请日:2022-06-08

    Abstract: 本发明属于数据挖掘异常检测技术领域,公开了一种基于生成式对抗主动学习的离群点检测方法,该方法步骤为:S1、输入数据;S2、训练生成模型并生成样本;S3、训练主动学习分类模型并筛选生成样本;S4、训练判别模型;S5、执行异常检测操作。本发明针对异常检测中常见的数据样本标签数量有限和正负样本不均匀分布等问题,采用基于生成式对抗主动学习的技术方法,生成多样的、信息丰富的、有代表性的样本,实现更准确的离群点检测。

    一种基于双层权重网络随机游走的top k非重叠多样化社区发现方法

    公开(公告)号:CN114943019A

    公开(公告)日:2022-08-26

    申请号:CN202210448476.6

    申请日:2022-04-27

    Abstract: 本发明属于图数据挖掘技术领域,公开了一种基于双层权重网络随机游走的top 非重叠多样化社区发现方法,包括如下步骤:步骤一:属性图数据、参数输入;步骤二:构造结构紧密性权重网络;步骤三:构造属性多样化增益权重网络;步骤四:基于双层权重网络的标签传播;步骤五:计算多样化社区度量,排序输出前个结果。本发明通过在原属性图基础上构造紧密度权重网络和属性多样化增益权重网络,实现在社区挖掘的过程中同时使用结构紧密和属性多样化双重约束。本方法在设计辅助网络权重时,通过引入几个超参数,使得算法具有灵活性和泛化性,可以根据实际应用的需要来调节属性约束和结构约束所占的比重。

    一种不确定的数据交互图中挖掘子图的方法及装置

    公开(公告)号:CN114399039A

    公开(公告)日:2022-04-26

    申请号:CN202111541216.5

    申请日:2021-12-16

    Abstract: 本发明公开了一种不确定的数据交互图中挖掘子图的方法及装置,输入不确定图、度数限制、概率临界值,不确定图用于表示连接关系不稳定的多个结点之间的关系,度数限制、概率临界值用于获取满足特定限制的子图;对不确定图进行剪枝;对剪枝后的不确定子图的每个结点,求出其出现的概率;对剪枝后的不确定子图中的每个结点进行遍历,当结点出现的概率小于概率临界值时,将结点从剪枝后的不确定子图中移除。采用本发明能够充分考虑了现实场景中数据的不稳定性对子图概率造成的波动,提高了子图挖掘的稳定性;同时使用三种剪枝算法,减少计算量,在相同挖掘场景下对比其他挖掘子图的算法大大降低了资源的消耗。

    基于约束子图计算的新冠肺炎感染人群分析方法及系统

    公开(公告)号:CN113658716A

    公开(公告)日:2021-11-16

    申请号:CN202110851425.3

    申请日:2021-07-27

    Abstract: 本发明属于公共卫生服务技术领域,具体涉及一种基于约束子图计算的新冠肺炎感染人群分析方法及系统,该方法步骤为:S1、新冠数据收集与清洗;S2、构建新冠肺炎场景下的人群图模型;S3、分析计算人群被感染概率指数;S4、发现潜在的感染人群并输出。本发明采用约束子图计算挖掘技术,综合多方面感染因素,通过定义计算被感染概率指数的方法,更有效的挖掘出潜在的新冠肺炎感染人群;基于被感染概率指数指标,设计新冠肺炎感染人群分析系统,设定不同级别的防疫应对举措,精确通知到管理部门和个体人群,为公共卫生防疫工作提供极大的助力,降低新冠感染概率,保护公众生命安全。

    一种利用微纳光纤在平面上检测负载位置和大小的方法及装置

    公开(公告)号:CN117990244A

    公开(公告)日:2024-05-07

    申请号:CN202410111758.6

    申请日:2024-01-26

    Abstract: 本发明公开了一种利用微纳光纤在平面上检测负载位置和大小的方法及装置。将一根微纳光纤布置在负载所在的平面之下,将负载施加到平面上,将负载施加前后经过微纳光纤的光谱变化数据输入到神经网络模型中对平面上负载的大小和位置进行检测,所述神经网络模型采用LSTM‑Attention‑CNN模型;装置包括白光光源、微纳光纤和用于光谱探测的光谱仪、用于放置微纳光纤的柔性基底、用于覆盖微纳光纤的柔性薄膜、三维调节架、三维压力传感器和按压头。本发明方法利用微纳光纤所在平面受到负载的变化特性和规律,通过深度学习算法对光谱进行解耦,从而实现对平面上的负载位置和大小的准确检测。

    一种基于最短路径和路径枚举的道路网选址方法和系统

    公开(公告)号:CN116450960A

    公开(公告)日:2023-07-18

    申请号:CN202310343069.3

    申请日:2023-04-03

    Abstract: 本发明公开了一种基于最短路径和路径枚举的道路网选址方法,首先读取真实道路网络数据集,提取其中的顶点和边数据,并根据提取的顶点和边数据建立无向有权图,使用函数readGraph()对无向有权图进行读取处理,以得到起点集合,使用函数readGraph()对无向有权图进行读取处理,以得到终点集合,使用深度优先搜索DFS方法对起点集合和终点集合进行处理,以得到所有起点到所有终点之间、且处于预设的路径阈值d范围内的所有路径,对每个起点到每个终点之间、且处于预设的路径阈值d范围内的所有路径进行降序排序处理,以得到每个起点到所有终点中的路径数量最大值及其对应的终点。本发明能够解决现有基于Dijkstra算法的道路网选址方法查询效率低的技术问题。

    基于异构图神经网络的流行病舆情实体识别方法与装置

    公开(公告)号:CN116386895A

    公开(公告)日:2023-07-04

    申请号:CN202310358447.5

    申请日:2023-04-06

    Inventor: 侯琳琳 张吉 余婷

    Abstract: 本发明公开了一种基于异构图神经网络的流行病舆情实体识别方法与装置,包括:采集流行病舆情文本,并按实体类别分类标注,再输入至BERT网络,得到第一特征向量;将第一特征向量输入BiLSTM,得到包含流行病舆情文本中各个字符对应的第二特征向量,将每个字符对应的第二特征向量组成第一向量表示矩阵;构建异构图,其中,异构图中的字符节点的初始向量表示为BiLSTM输出的各个字符对应的第二特征向量,子句虚拟节点的初始向量表示为子句中每一字符对应的第二特征向量的平均值;利用异构图注意力网络算法对异构图进行聚合更新,得到第二向量表示矩阵;将第二向量表示矩阵拼接于第一向量表示矩阵后,将拼接结果输入至条件随机场预测模型,得到预测标签。

Patent Agency Ranking