-
公开(公告)号:CN109741198A
公开(公告)日:2019-05-10
申请号:CN201811434864.9
申请日:2018-11-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种网络信息传播影响力度量方法、系统,包括:根据社交网络中消息传播的历史传播数据,构建节点和传播源的激活对;将社交网络中的用户作为节点,将给定消息的传播数据中参与时间为0的节点作为给定消息的传播源,通过聚合函数将传播源对节点的影响力进行聚合后通过影响力边际递减函数,得到节点在传播源下被激活的概率;以历史传播数据为训练数据,以概率的对数似然最大作为目标,对所有激活对使用随机梯度下降进行参数学习,得到节点间影响力,以得到传播源集合的影响力度量。本发明提出的基于数据驱动的影响力最大化方法直接基于本发明学习得到的影响力度量,对节点的边际效应进行估计,以高效地进行影响力最大化的节点集合选择。
-
公开(公告)号:CN106503858A
公开(公告)日:2017-03-15
申请号:CN201610958907.8
申请日:2016-10-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种训练用于预测社交网络用户转发消息的模型的方法,包括:确定以社交网络中的每名用户的影响力和易感性为参数的损失函数;收集各名用户以往进行消息转发的样本;根据所述样本和所述损失函数,搜索确定所述各名用户的影响力和易感性。本发明通过根据信息传播过程的不对称性来建立模型,从而提高模型的预测性能,并且可以区分预测用户列表不同位置用户对的重要性差别。
-
公开(公告)号:CN114443820B
公开(公告)日:2025-02-07
申请号:CN202210177000.3
申请日:2022-02-25
Applicant: 中国科学院计算技术研究所
IPC: G06F16/334 , G06F16/3332 , G06F16/31 , G06F40/216 , G06F40/237 , G06F40/284
Abstract: 本发明提供了一种文本聚合方法以及文本推荐方法,该一种文本聚合方法包括获取待处理的文本;利用经改进的SimHash算法计算文本的指纹信息,其中,经改进的SimHash算法在对文本中相应词语的哈希值进行加权时,利用词语在该文本内的权值以及在该文本所处领域中该词语的领域权值进行加权;利用领域权值对文本的领域关联性进行打分,得到文本的领域分值;将文本的指纹信息分为多个指纹段,基于指纹段的数值构建倒排索引,其中,倒排索引对应的键值对中,键存储指纹段的数值,值存储文本相关信息,文本相关信息包括文本的指纹信息和领域分值;通过领域权重对文本进行打分,构建倒排索引,以避免后期推荐相似文本时重复处理数据库内的文本,极大地提升了处理效率。
-
公开(公告)号:CN119068503A
公开(公告)日:2024-12-03
申请号:CN202411015967.7
申请日:2024-07-26
Applicant: 中国科学院计算技术研究所
IPC: G06V30/412 , G06V30/19 , G06V10/774 , G06V10/82
Abstract: 本发明提出一种文本检测方法、装置、介质,该方法包含:对待测文本进行扰动处理,得到扰动文本;对该扰动文本进行语法树分析,识别文本的若干词语及词语间的语法结构,生成语法树;遍历该语法树,将该语法树中的每一个词语构建为图神经网络训练所需的节点,并将词语间的语法结构编码为邻接矩阵;对该扰动文本进行向量化处理,得到文本的高维向量表示;融合该高维向量表示和该邻接矩阵,通过图卷积神经网络进行训练,以预测该待测文本的类别标签。该方法实现了对扰动后生成文本的高精准度检测,同时使检测方法具有很强的鲁棒性。
-
公开(公告)号:CN118070071A
公开(公告)日:2024-05-24
申请号:CN202410353576.X
申请日:2024-03-26
Applicant: 中国科学院计算技术研究所
IPC: G06F18/22 , G06F18/23213 , G06F18/2433 , G06F18/25 , G06N3/0464 , G06N3/042 , G06N3/0455 , G06Q50/00 , G06N3/048
Abstract: 本发明提出一种基于图卷积聚类的社交机器人群体检测方法,包括:使用已知账号的个体特征,训练专家模型;获取目标账号的个体特征,通过该专家模型将该目标账号识别为种子账号或待定账号;以图卷积聚类方法,将该目标账号划分为多个群体,获取每个群体的群体特征;将该目标账号的个体特征,与其所在群体的群体特征进行拼接融合,获得该目标账号的识别特征;将该待定账号的识别特征与其所在群体的种子账号的识别特征进行相似度比较,以相似度大于识别阈值的待定账号为识别账号;将该种子账号和该识别账号标识为社交机器人。本发明还提出一种基于图卷积聚类的社交机器人群体检测装置,以及一种计算机可读存储介质和一种电子设备。
-
公开(公告)号:CN117668857A
公开(公告)日:2024-03-08
申请号:CN202311675503.4
申请日:2023-12-07
Applicant: 中国科学院计算技术研究所
IPC: G06F21/57 , G06F18/22 , G06F18/214
Abstract: 本发明提出一种基于模拟数据投毒攻击的推荐系统安全性测试方法和系统。通过梯度传递技术可以加速替代推荐系统的训练过程,以在有限时间内得到更准确的替代模型。梯度传递技术可以增强现有模拟攻击样本的准确性。通过加速替代模型训练得到更准确的替代模型,可以从替代模型中获得更好的优化指导,从而增强现有模拟攻击样本的准确性。梯度传递可以广泛增强基于替代系统的攻击方法,包括大部分现有的推荐系统模拟投毒攻击,这为后续的研发提供了基础。同时,也可以帮助发现了推荐系统的弱点,为设计更可靠的防御方法提供启示。
-
公开(公告)号:CN116662480A
公开(公告)日:2023-08-29
申请号:CN202310505568.8
申请日:2023-05-06
Applicant: 中国科学院计算技术研究所
IPC: G06F16/33 , G06F40/30 , G06F40/295 , G06N5/022 , G06N3/045
Abstract: 本发明提出一种基于实体增强的文本语义表示方法和系统,包括:获取文本编码模型和实体增强编码模型,实体增强编码模型由串联的外部实体向量表示模块和上下文相关的实体信息编码模块组成;通过文本编码模型提取目标文本的第一表示向量;以外部实体向量表示模块识别目标文本中表示实体的词项序列,并确定词项序列和知识库中的哪些实体相关联,获得词项序列对应实体的在知识库中的实体向量表示;实体信息编码模块包括多个串联的实体适配器层,实体信息编码模块的输入为实体向量表示和文本编码模型中间层的隐状态;最后一个实体适配器层输出的特征作为目标文本的第二表示向量;融合第一表示向量和第二表示向量,得到目标文本的语义表示结果。
-
公开(公告)号:CN116628353A
公开(公告)日:2023-08-22
申请号:CN202310524795.5
申请日:2023-05-10
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9536 , G06Q50/00 , G06F16/36 , G06F16/35 , G06F40/295 , G06F18/24 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明提出一种基于图表示学习的多视角个体观点预测方法,包括:分别构建观点持有者的背景知识图谱、交互行为网络和观点网络;以该观点持有者、目标观点对象和观点生成时刻为要素,构建观点预测任务的目标三元组;从该背景知识图谱、该交互行为网络和该观点网络,分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。本发明还提出一种基于图表示学习的多视角个体观点预测系统,以及一种用于多视角个体观点预测的数据处理装置。
-
公开(公告)号:CN115391522A
公开(公告)日:2022-11-25
申请号:CN202210921496.0
申请日:2022-08-02
Applicant: 中国科学院计算技术研究所
IPC: G06F16/35 , G06F40/30 , G06F40/258 , G06F40/295 , G06Q50/00 , G06N3/08
Abstract: 本发明提出一种基于社交平台元数据的文本主题建模方法和系统,包括基于文本数据的关键词,构建文本数据的词袋表示;基于文本数据的元数据类别,训练对应类别的属性值预测任务,以微调预训练语义提取模型,得到目标语义提取模型,使用目标语义提取模型提取文本数据的文本语义表示;基于文本语义表示构造语义约束目标,以语义约束目标为指导,以词袋表示作为输入和重构目标,训练基于变分自编码器的神经主题模型,得到主题提取模型,并从模型中导出主题‑关键词分布和主题嵌入表示。方法及系统可以对移动应用内广泛存在的短文本消息进行主题建模,提取出主题的关键词并学习得到主题的嵌入表示。
-
公开(公告)号:CN114418060A
公开(公告)日:2022-04-29
申请号:CN202111588857.6
申请日:2021-12-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种基于图表示学习的身份保持对抗训练方法、装置、介质,所述方法包括:获取训练场景的图数据,定义图数据的每一个节点为用于表征训练场景的一个原样本,定义原样本的样本身份信息;生成每一个原样本对应的对抗样本;通过为对抗样本添加身份保持约束,将对抗样本保持原样本的样本身份信息;将对抗样本作为第一输入变量,输入至初始图表示学习模型,执行身份保持对抗训练;更新初始图表示学习模型,得到目标图表示学习模型,利用目标图表示学习模型预测训练场景中所述原样本在不同图挖掘任务下的输出。该方法将对抗样本与原样本保持相同的样本身份信息,提升了图表示学习在图结构数据分析中的精度,具有一定的普适性。
-
-
-
-
-
-
-
-
-