一种带有时限社区的时序图生成方法及装置

    公开(公告)号:CN118262008A

    公开(公告)日:2024-06-28

    申请号:CN202410544086.8

    申请日:2024-04-30

    申请人: 清华大学

    IPC分类号: G06T11/20

    摘要: 本公开涉及一种带有时限社区的时序图生成方法及装置,其中,该方法包括:对目标场景中的节点集合进行分组,得到各时限社区包含的节点;多个时限社区中包含的节点数量符合幂律分布;为多个时限社区中各时限社区均生成一个时间窗口;其中,多个时限社区对应的时间窗口的起始时刻符合均匀分布、对应的时间窗口的长度符合幂律分布;构建可在不同时限社区之间迁移的索引结构,并基于各时限社区包含的节点、各时限社区的时间窗口及索引结构,生成各时限社区内的时序边和/或多个时限社区中不同时限社区之间的时序边,进而生成目标场景的时序图。通过本公开,以灵活配置和高效率的方式生成含有时限社区的时序图。

    身份映射匹配方法、装置、设备及介质

    公开(公告)号:CN117633747A

    公开(公告)日:2024-03-01

    申请号:CN202311658508.6

    申请日:2023-12-05

    摘要: 本公开实施例提供一种身份映射匹配方法、装置、设备及介质。以解决相关技术中身份映射匹配算法时间复杂度较高、并行计算困难,且匹配结果误差大,进而影响用户体验的问题,该身份映射匹配方法包括:获取设备身份标识和用户身份标识,并利用所述设备身份标识和所述用户身份标识生成二分属性图;根据所述设备身份标识和所述用户身份标识确定所述二分属性图中边的权值;基于所述二分属性图中边的权值进行匹配,得到所述设备身份标识和所述用户身份标识的对应关系。

    模型训练方法、信息生成方法、装置、设备和介质

    公开(公告)号:CN117454935A

    公开(公告)日:2024-01-26

    申请号:CN202311212523.8

    申请日:2023-09-19

    IPC分类号: G06N3/0464 G06N3/042 G06N3/08

    摘要: 本公开的实施例公开了模型训练方法、信息生成方法、装置、设备和介质。该方法的一具体实施方式包括:生成价值数据关联图;利用所确定的初始图信息生成模型,对该价值数据关联图添加目标价值类别对应的至少一个图节点信息和至少一个边信息,得到添加后价值数据关联图;确定每个图节点信息对应的节点特征表征信息,得到节点特征表征信息集;利用初始图信息判别模型,生成针对该节点特征表征信息集的判别信息集;根据判别信息集,对初始图信息生成模型和初始图信息判别模型进行模型训练,得到图信息生成模型和图信息判别模型。该实施方式与人工智能有关,可以利用图信息生成模型和图信息判别模型,来精准地生成价值数据对应的价值异常信息。

    面向跨网络的表示学习算法
    4.
    发明公开

    公开(公告)号:CN113228059A

    公开(公告)日:2021-08-06

    申请号:CN202080005540.2

    申请日:2020-04-03

    申请人: 清华大学

    发明人: 王朝坤 严本成

    IPC分类号: G06N3/08 G06N3/04

    摘要: 本公开提出一种面向跨网络的表示学习算法,包括:S1,生成包括源网络和目标网络的网络数据;S2,分别从源网络和目标网络随机采样设定数量的节点,并整理成满足算法输入的数据格式;S3,得到源网络和目标网络的输入数据后,分别将其输入到一个L层的神经网络,并对每一层分别计算源网络和目标网络的结构特征和表达特征,计算源网络和目标网络的对应特征之间的距离损失;S4,将从L层的神经网络中得到的源网络节点的表达向量进行分类预测概率计算,通过交叉熵损失函数计算分类损失,并且结合距离损失,通过反向传播算法更新神经网络参数;S5,重复步骤S2‑S4,直至整个算法收敛。本公开有效地解决了跨网络表示学习问题,在现实中有着广阔的应用空间。

    社区搜索方法
    5.
    发明公开

    公开(公告)号:CN109543077A

    公开(公告)日:2019-03-29

    申请号:CN201811205006.7

    申请日:2018-10-16

    申请人: 清华大学

    发明人: 王朝坤 竺俊超

    IPC分类号: G06F16/903

    摘要: 本发明实施例公开了一种社区搜索方法,包括:根据用户对于社区搜索的需求,将节点对应于节点变量,写出对应的搜索条件;将搜索条件转化为多个搜索项;对于每一搜索项进行单项条件的社区搜索;将各个单项条件社区搜索的结果合并,对社区结果取并集进行返回。本发明将搜索条件统一为布尔表达式形式,便于用户进行个性化表达搜索需求和复杂条件下社区搜索的执行;由于在搜索时考虑了用户不希望出现在社区内的节点,其结果更符合用户的期望;由于允许社区中至少包含给定节点中一个的需求,一个搜索条件可能得到多个不同的社区结果,且都满足搜索条件,使得用户对结果的选择更为丰富;提供了多种不同的实现方式,可以根据实际需要进行选择。

    一种基于社区结构的子图匹配方法及装置

    公开(公告)号:CN109063089A

    公开(公告)日:2018-12-21

    申请号:CN201810836811.3

    申请日:2018-07-26

    申请人: 清华大学

    发明人: 王朝坤 楼昀恺

    IPC分类号: G06F17/30

    摘要: 本发明公开一种基于社区结构的子图匹配方法及装置,方法包括:导入包含目标模式的文件,分析目标模式结构,找出目标模式中互相匹配等价的子图;根据网络图数据生成以社区作为结点的超图,计算每个社区中各结点与本社区的邻接社区间的边数;在网络图各社区内部利用预设子图匹配算法找出各社区的与目标模式结构匹配的子图,获得第一匹配结果;在网络图中,基于网络图每个社区中各结点与本社区的各邻接社区间的边数和找出的目标模式中互相匹配等价的子图找出跨社区的与目标模式匹配的子图,获得第二匹配结果;将第一、二匹配结果汇总获得最终子图匹配结果。可提高子图匹配速度,减少时间开销。

    基于社区的节点介数中心度更新方法

    公开(公告)号:CN108255987A

    公开(公告)日:2018-07-06

    申请号:CN201711463758.9

    申请日:2017-12-28

    申请人: 清华大学

    IPC分类号: G06F17/30 G06Q50/00 H04L12/24

    摘要: 本发明公开一种基于社区的节点介数中心度更新方法,包括:利用非重叠社区发现算法将现有的网络划分成多个社区;计算出所有节点间最短距离和每个节点的介数中心度;计算出社区与节点、社区与社区的最短距离集合;过滤网络中所有的点对,找到网络更新后最短路径发生改变的点对;删去原有最短路径对节点介数中心度的影响,计算点对的新最短路径,并添加新最短路径对节点介数中心度的影响;更新社区与节点、社区与社区的最短距离集合。本发明在网络变化的过程中,不需要重新计算所有节点的介数中心度,而是采用过滤的思路,只需部分更新点对最短路径并得到介数中心度,效率较高,此外,本发明的算法同时适用于无向图和有向图。

    多维网络基于介数中心度进行网络分析的方法

    公开(公告)号:CN104168158B

    公开(公告)日:2018-05-01

    申请号:CN201410403859.7

    申请日:2014-08-15

    申请人: 清华大学

    IPC分类号: H04L12/26 H04L12/24

    摘要: 本发明公开一种多维网络基于介数中心度进行网络分析的方法,涉及计算机社交网络技术领域,包括:根据实际网络关系生成多维网络的函数;所述多维网络的函数与实际网络中的节点、维度边和边的维度相关;将所述多维网络中相邻节点之间的维度边通过映射函数映射到一维上,从而得到所述多维网络对应的一维网络;计算动态网络中所有个体的局部介数中心度;按照所计算的局部介数中心度对网络进行分析。本发明提供的多维网络基于介数中心度进行网络分析的方法,通过在网络分析中快速准确地定位个体所处桥接位置的重要性,找到网络中真正起到沟通连接作用的重要个体,以此分析并控制网络中信息的传播和个体间的交流情况。

    多维属性最优点组的快速搜索方法

    公开(公告)号:CN107633024A

    公开(公告)日:2018-01-26

    申请号:CN201710764716.2

    申请日:2017-08-30

    申请人: 清华大学

    IPC分类号: G06F17/30 G06F8/30

    摘要: 本发明公开一种多维属性最优点组的快速搜索方法,包括:设计基础MDG构建算法;使用R-tree索引对基础MDG构建算法进行优化;基于MDG搜索所有的g-skyline组。本发明提出了一种R-tree的变种来加速构建多维数据的MDG,提出了P-MDS和G-MDS两种基于MDG的g-skyline组搜索算法,它们能够基于不同的策略生成候选组,同时利用skyline组合性质显著提升了这两个算法的效率,通过实验证明,G-MDS算法的效率比现有的最好的g-skyline搜索算法往往高1-2个数量级,本发明提出的最优点组搜索算法非常高效。

    一种基于音频特征的数字音频延展方法

    公开(公告)号:CN102855883B

    公开(公告)日:2014-09-24

    申请号:CN201110177195.3

    申请日:2011-06-28

    申请人: 清华大学

    IPC分类号: G10L21/04

    摘要: 本发明提供了一种基于音频特征的数字音频延展方法,在数字音频时域延展前,根据乐曲段落的相似性在乐曲中选择合适的位置插入音频片段,保证插入操作后音频片段之间自然衔接。在插入操作后,通过计算音频片段的延展抗性找出最优的可延展片段进行适度延展,重复进行至达到延展要求,最大限度地降低音频延展对于音频质量的影响,保证整首乐曲在延展后的播放效果,由于乐曲在被延展后听觉效果与原乐曲接近,没有破坏乐曲的欣赏性。