一种基于关联融合的环境监测数据补全方法及系统

    公开(公告)号:CN113392139B

    公开(公告)日:2023-10-20

    申请号:CN202110624648.6

    申请日:2021-06-04

    Abstract: 本发明提出一种基于关联融合的环境监测数据补全方法和系统,包括:获取数据存在缺失的环境监测数据及其对应的标记矩阵;根据环境监测数据中每个时间点的各个属性,得到属性间的关联系数,以构建图G,图G中节点对应属性,节点间的边对应属性间的属性关联系数;通过将图G和待补全矩阵按位相乘,得到中间矩阵,通过神经网络对中间矩阵进行时序处理,得到环境监测数据中各时间点的隐藏状态;根据各时间点的隐藏状态,计算环境监测数据的时间关联性系数;通过将时间关联性系数和各时间点的隐藏状态按位相乘,得到环境监测数据中各时间点的中间状态;在环境监测数据中,对中间状态采用生成式的非线性变换,得到环境监测数据的重构补全数据。

    流式图中的洗钱行为检测方法、装置、介质

    公开(公告)号:CN114581230A

    公开(公告)日:2022-06-03

    申请号:CN202210044130.X

    申请日:2022-01-14

    Abstract: 本发明提出一种流式图中的洗钱行为检测方法、装置、介质,所述方法包括获取洗钱场景中的资金交易信息作为图数据通过有向图表示;在每一条所述资金流到达时,判断所述发生源账户是否在转出资金后达到资金平衡状态,且所述目标账户是否在转入资金后到达资金平衡状态;分别统计当前时刻时所述发生源账户与目标账户达到资金平衡状态的次数以及从初始时刻到当前时刻最近一次达到资金平衡状态之间累积的资金有效转入次数,作为统计特征输入至异常账户评估模型进行异常评估。该方法能够快速并且准确地检测出不同模式的洗钱行为,并且找到可疑的洗钱账户。

    一种基于相似话题的流行度预测方法及系统

    公开(公告)号:CN113780569A

    公开(公告)日:2021-12-10

    申请号:CN202110813797.7

    申请日:2021-07-19

    Abstract: 本发明提出一种基于相似话题的流行度预测方法和系统,基于KSC算法对历史话题的流行度序列聚类,得到话题级别的演化模式,按照待预测话题的观测窗口和预测窗口大小,对各历史话题的流行度序列进行切分得到训练数据的输入和输出,使用各类别下的历史话题的训练数据分别训练全连接网络作为预测模型,充分利用了与待预测话题在流行度演化模式上相似的历史话题的数据,降低了预测误差。基于DTW算法对待预测话题进行分类,使用待预测话题所属类别的模型进行流行度预测,保证预测及时,增强预测的时效性。

    一种提高图数据上鲁棒性的对抗免疫方法

    公开(公告)号:CN113762465A

    公开(公告)日:2021-12-07

    申请号:CN202110879783.5

    申请日:2021-08-02

    Abstract: 本发明提供一种保护图数据的方法,所述图数据包括节点和节点之间的边,所述节点具有分类标签与属性,所述方法包括:步骤100:从图数据中选择关键节点对;步骤200:对所选择的关键节点对进行免疫保护,所述免疫保护包括:保护同一类别下属性高度相似的节点对之间的连边,以及保持不同类下属性相似度低的节点对间没有连边。本发明首次提出面向数据的对抗免疫方法,不需要影响GNN模型的训练过程,也不需要任何优化过程,节省了优化所需的大量算力和时间。对抗免疫直接为关键节点对“接种疫苗”,保护它们免受攻击损害,从而提高整个图的鲁棒性,同时保证了GNN在干净图上的性能。

    一种基于关联融合的多元时间序列补全方法及系统

    公开(公告)号:CN113392139A

    公开(公告)日:2021-09-14

    申请号:CN202110624648.6

    申请日:2021-06-04

    Abstract: 本发明提出一种基于关联融合的多元时间序列补全方法和系统,包括:获取数据存在缺失的多元时间序列及其对应的标记矩阵;根据多元时间序列中每个时间点的各个属性,得到属性间的关联系数,以构建图G,图G中节点对应属性,节点间的边对应属性间的属性关联系数;通过将图G和待补全矩阵按位相乘,得到中间矩阵,通过神经网络对中间矩阵进行时序处理,得到多元时间序列中各时间点的隐藏状态;根据各时间点的隐藏状态,计算多元时间序列的时间关联性系数;通过将时间关联性系数和各时间点的隐藏状态按位相乘,得到多元时间序列中各时间点的中间状态;在多元时间序列中,对中间状态采用生成式的非线性变换,得到多元时间序列的重构补全数据。

    一种训练用于预测社交网络用户转发消息的模型的方法

    公开(公告)号:CN107566249B

    公开(公告)日:2020-12-29

    申请号:CN201710727462.7

    申请日:2017-08-23

    Abstract: 一种训练用于预测社交网络用户转发消息的模型的方法,包括:1)获得所述社交网络中的历史数据,所述历史数据包括不同用户对同一条消息进行发布、转发的次序;2)根据所述历史数据,求解使得损失函数取值最小时各名用户的影响力和易感性;其中,所述影响力用于描述该名用户发布的消息被转发的概率,所述易感性用于描述该名用户受到发布消息的源发用户的影响而对所述消息进行转发的概率,所述损失函数是发布消息的源发用户的影响力、除所述源发用户之外的其他用户的易感性的函数;以及其中,所述用户的影响力和易感性作为所述用于预测社交网络用户转发消息的模型的参数。

    针对流式图的密集子图检测方法及系统

    公开(公告)号:CN109753797B

    公开(公告)日:2020-11-03

    申请号:CN201811503421.0

    申请日:2018-12-10

    Abstract: 本发明涉及一种针对流式图的密集子图检测方法和系统,包括:持续从社交网络获取三元组,该三元组由用户、对象和时间戳组成,以该三元组作为流式图建模为行增广矩阵;用滑动窗口访问行增广矩阵,并对每个窗口内的行增广矩阵进行奇异值分解,得到奇异矩阵,获取奇异矩阵的奇异向量对,根据向量阈值对该奇异向量对进行筛选,得到候选密集块及其密度;通过对候选密集块利用已有方法进一步进行密集子块筛选;最终密集块的用户为检测的异常用户、其中的目标物为检测的异常目标。本发明根据增广矩阵和滑动窗口对流式图建模,每次只存储一个步长的数据,每次检测一个窗口的数据,性能优于每插入一条新数据都要更新密集块的流式算法。

    一种基于视觉特征的图数据检测方法、系统

    公开(公告)号:CN109828995A

    公开(公告)日:2019-05-31

    申请号:CN201811533324.6

    申请日:2018-12-14

    Abstract: 本发明涉及一种基于视觉特征的图数据检测方法和系统,包括:获取待分析的图数据,并统计该图数据的分布特征;将该分布特征输入基于视觉特征的分类模型,得到该图数据中具有相同类别的节点,通过将类别相同的该节点划分至同一分组,得到多个分组;利用基于视觉的分析模型对该分组进行聚合分析,得到每个分组的聚类特征,根据每个分组的该聚类特征进行模式总结和异常检测处理,并将每个分组的该聚类特征、模式总结结果和异常检测结果作为该图数据的检测结果。本发明不直接对大图数据的邻接矩阵或者拉普拉斯矩阵进行分解操作,处理速度快,效率高,具有更强的及时性。

    一种面向大模型的数据溯源方法及其系统

    公开(公告)号:CN119358670A

    公开(公告)日:2025-01-24

    申请号:CN202411351041.5

    申请日:2024-09-26

    Abstract: 本申请公开了一种面向大模型的数据溯源方法,方法包括:构建待输入大模型的测试样本集合;对于测试数据集合,采用去偏修正方法,计算每个训练样本和测试样本在训练后模型和训练前模型上的去偏影响分数;根据在训练后模型和训练前模型上的去偏影响分数进行去偏计算,获取每条训练数据的最终影响分数,根据最终影响分数,实现数据的溯源分析。本发明在去偏修正方法的基础上还包括了去噪修正方法。本发明实现的影响分数方法能够更有效地评估训练数据溯源方法的准确性和可靠性。

    一种面向大模型安全评测的评测样本自动生成方法及装置

    公开(公告)号:CN119004104A

    公开(公告)日:2024-11-22

    申请号:CN202411083246.X

    申请日:2024-08-08

    Abstract: 本发明提出一种面向大模型安全评测的评测样本自动生成方法和装置,包括:测评问题集包含多个用于测试大语言模型安全性的评测样本,以具有诱导内容的任务提示为输入,以该任务提示对应的该评测样本标签,微调训练大语言模型输出评测样本,得到评测样本生成模型;根据评测样本的安全风险类别,构建检索问句,检索互联网中属于该安全风险类别的数据资料;根据该安全风险类别以及该数据资料,合成提示文本;从该测评问题集中抽取属于该安全风险类别的评测样本填充至该提示文本后作为任务提示输入该评测样本生成模型,生成用于测试大语言模型的测试样本。

Patent Agency Ranking