网络信息传播影响力度量方法、系统及影响力最大化方法

    公开(公告)号:CN109741198A

    公开(公告)日:2019-05-10

    申请号:CN201811434864.9

    申请日:2018-11-28

    Abstract: 本发明涉及一种网络信息传播影响力度量方法、系统,包括:根据社交网络中消息传播的历史传播数据,构建节点和传播源的激活对;将社交网络中的用户作为节点,将给定消息的传播数据中参与时间为0的节点作为给定消息的传播源,通过聚合函数将传播源对节点的影响力进行聚合后通过影响力边际递减函数,得到节点在传播源下被激活的概率;以历史传播数据为训练数据,以概率的对数似然最大作为目标,对所有激活对使用随机梯度下降进行参数学习,得到节点间影响力,以得到传播源集合的影响力度量。本发明提出的基于数据驱动的影响力最大化方法直接基于本发明学习得到的影响力度量,对节点的边际效应进行估计,以高效地进行影响力最大化的节点集合选择。

    一种文本聚合方法以及文本推荐方法

    公开(公告)号:CN114443820B

    公开(公告)日:2025-02-07

    申请号:CN202210177000.3

    申请日:2022-02-25

    Abstract: 本发明提供了一种文本聚合方法以及文本推荐方法,该一种文本聚合方法包括获取待处理的文本;利用经改进的SimHash算法计算文本的指纹信息,其中,经改进的SimHash算法在对文本中相应词语的哈希值进行加权时,利用词语在该文本内的权值以及在该文本所处领域中该词语的领域权值进行加权;利用领域权值对文本的领域关联性进行打分,得到文本的领域分值;将文本的指纹信息分为多个指纹段,基于指纹段的数值构建倒排索引,其中,倒排索引对应的键值对中,键存储指纹段的数值,值存储文本相关信息,文本相关信息包括文本的指纹信息和领域分值;通过领域权重对文本进行打分,构建倒排索引,以避免后期推荐相似文本时重复处理数据库内的文本,极大地提升了处理效率。

    文本检测方法、装置、介质
    64.
    发明公开

    公开(公告)号:CN119068503A

    公开(公告)日:2024-12-03

    申请号:CN202411015967.7

    申请日:2024-07-26

    Abstract: 本发明提出一种文本检测方法、装置、介质,该方法包含:对待测文本进行扰动处理,得到扰动文本;对该扰动文本进行语法树分析,识别文本的若干词语及词语间的语法结构,生成语法树;遍历该语法树,将该语法树中的每一个词语构建为图神经网络训练所需的节点,并将词语间的语法结构编码为邻接矩阵;对该扰动文本进行向量化处理,得到文本的高维向量表示;融合该高维向量表示和该邻接矩阵,通过图卷积神经网络进行训练,以预测该待测文本的类别标签。该方法实现了对扰动后生成文本的高精准度检测,同时使检测方法具有很强的鲁棒性。

    基于模拟数据投毒攻击的推荐系统安全性测试方法及系统

    公开(公告)号:CN117668857A

    公开(公告)日:2024-03-08

    申请号:CN202311675503.4

    申请日:2023-12-07

    Abstract: 本发明提出一种基于模拟数据投毒攻击的推荐系统安全性测试方法和系统。通过梯度传递技术可以加速替代推荐系统的训练过程,以在有限时间内得到更准确的替代模型。梯度传递技术可以增强现有模拟攻击样本的准确性。通过加速替代模型训练得到更准确的替代模型,可以从替代模型中获得更好的优化指导,从而增强现有模拟攻击样本的准确性。梯度传递可以广泛增强基于替代系统的攻击方法,包括大部分现有的推荐系统模拟投毒攻击,这为后续的研发提供了基础。同时,也可以帮助发现了推荐系统的弱点,为设计更可靠的防御方法提供启示。

    一种基于实体增强的文本语义表示方法及系统

    公开(公告)号:CN116662480A

    公开(公告)日:2023-08-29

    申请号:CN202310505568.8

    申请日:2023-05-06

    Abstract: 本发明提出一种基于实体增强的文本语义表示方法和系统,包括:获取文本编码模型和实体增强编码模型,实体增强编码模型由串联的外部实体向量表示模块和上下文相关的实体信息编码模块组成;通过文本编码模型提取目标文本的第一表示向量;以外部实体向量表示模块识别目标文本中表示实体的词项序列,并确定词项序列和知识库中的哪些实体相关联,获得词项序列对应实体的在知识库中的实体向量表示;实体信息编码模块包括多个串联的实体适配器层,实体信息编码模块的输入为实体向量表示和文本编码模型中间层的隐状态;最后一个实体适配器层输出的特征作为目标文本的第二表示向量;融合第一表示向量和第二表示向量,得到目标文本的语义表示结果。

    一种基于社交平台元数据的文本主题建模方法及系统

    公开(公告)号:CN115391522A

    公开(公告)日:2022-11-25

    申请号:CN202210921496.0

    申请日:2022-08-02

    Abstract: 本发明提出一种基于社交平台元数据的文本主题建模方法和系统,包括基于文本数据的关键词,构建文本数据的词袋表示;基于文本数据的元数据类别,训练对应类别的属性值预测任务,以微调预训练语义提取模型,得到目标语义提取模型,使用目标语义提取模型提取文本数据的文本语义表示;基于文本语义表示构造语义约束目标,以语义约束目标为指导,以词袋表示作为输入和重构目标,训练基于变分自编码器的神经主题模型,得到主题提取模型,并从模型中导出主题‑关键词分布和主题嵌入表示。方法及系统可以对移动应用内广泛存在的短文本消息进行主题建模,提取出主题的关键词并学习得到主题的嵌入表示。

    基于图表示学习的身份保持对抗训练方法、装置、介质

    公开(公告)号:CN114418060A

    公开(公告)日:2022-04-29

    申请号:CN202111588857.6

    申请日:2021-12-23

    Abstract: 本发明提供了一种基于图表示学习的身份保持对抗训练方法、装置、介质,所述方法包括:获取训练场景的图数据,定义图数据的每一个节点为用于表征训练场景的一个原样本,定义原样本的样本身份信息;生成每一个原样本对应的对抗样本;通过为对抗样本添加身份保持约束,将对抗样本保持原样本的样本身份信息;将对抗样本作为第一输入变量,输入至初始图表示学习模型,执行身份保持对抗训练;更新初始图表示学习模型,得到目标图表示学习模型,利用目标图表示学习模型预测训练场景中所述原样本在不同图挖掘任务下的输出。该方法将对抗样本与原样本保持相同的样本身份信息,提升了图表示学习在图结构数据分析中的精度,具有一定的普适性。

Patent Agency Ranking