双编码器证据蒸馏神经网络的可解释性虚假新闻检测方法

    公开(公告)号:CN117349500B

    公开(公告)日:2024-09-10

    申请号:CN202311351066.0

    申请日:2023-10-18

    发明人: 朱小飞 胡昌江

    摘要: 本发明具体涉及双编码器证据蒸馏神经网络的可解释性虚假新闻检测方法,包括:通过虚假新闻检测模型输出新闻的真实性预测标签和真实性解释;训练模型时包括:编码新闻向量表示和原始报告文档表示;基于Gumbel‑softmax函数选取有价值报告;从有价值报告中提取可解释性句子;分别构建新闻图结构和原始报告图结构并实现图注意力交互,生成原始报告增强的新闻表示;生成最终向量表示并通过分类器生成新闻的真实性预测标签;通过提取的可解释性句子组成新闻的真实性解释;计算模型损失来优化模型参数,直至模型收敛。本发明能够有效解决有价值报告选取时固定K值的问题,同时能够从有价值的报告中提取可解释性句子来实现新闻虚假检测。

    基于主题指导和双全局注意力的会话推荐方法

    公开(公告)号:CN113935811B

    公开(公告)日:2024-05-14

    申请号:CN202111247515.8

    申请日:2021-10-26

    发明人: 朱小飞 唐顾

    摘要: 本发明涉及互联网大数据技术领域,具体涉及一种基于主题指导和双全局注意力的会话推荐方法,其首先,基于注意力机制从目标会话文本的不同角度提取包含体现共现关系的显式全局嵌入表示和体现语义关系的隐式全局嵌入表示的全局嵌入表示;然后,从目标会话文本中提取对应的主题嵌入表示;最后,基于主题嵌入表示指导全局嵌入表示进行预测,以生成最终预测概率分布,并基于最终预测概率分布进行商品推荐。本发明中基于主题指导和双全局注意力的会话推荐方法能够兼顾商品分布概率预测的全面性和准确性。

    联合互补知识迁移与目标域特征抽取的跨域推荐方法

    公开(公告)号:CN116051224B

    公开(公告)日:2024-01-23

    申请号:CN202211313565.6

    申请日:2022-10-25

    IPC分类号: G06Q30/0601 G06F16/9535

    摘要: 本发明涉及跨域推荐技术领域,具体涉及联合互补知识迁移与目标域特征抽取的跨域推荐方法,包括:获取存在于目标域的冷启动用户在目标域中的若干个待推荐商品;将冷启动用户的源域用户表示输入经过训练的跨域推荐模型,输出对应的目标域最终用户表示;基于冷启动用户的目标域最终用户表示结合对应待推荐的目标域商品表示计算对应冷启动用户对于待推荐商品的目标域预测分数;将目标域预测分数最高的一个或多个待推荐商品作为冷启动用户的推荐结果。本发明的跨域推荐方法能够实现用户共性属性与个性属性的互补,并能够充分挖掘目标域自身的知识。

    基于类别感知课程学习的半监督立场检测方法

    公开(公告)号:CN117407752A

    公开(公告)日:2024-01-16

    申请号:CN202311366045.6

    申请日:2023-10-20

    发明人: 朱小飞 高肇泽

    摘要: 本发明具体涉及基于类别感知课程学习的半监督立场检测方法,包括:通过立场检测模型中检测推文的预测立场标签;训练模型时包括:通过有标签推文集合对立场检测模型进行预训练;将无标签推文集合输入预训练的立场检测模型,输出无标签推文的伪标签,生成带伪标签的无标签推文集合;基于课程学习从带伪标签的无标签推文集合中选取对应的无标签推文来构成伪标签推文集合;通过伪标签推文集合对预训练的立场检测模型进行优化,得到最终的立场检测模型。本发明通过半监督立场检测降低模型训练对标注数据的需求,同时通过课程学习框架来更好的关注半监督立场检测所需的伪标签质量,并且在选取伪标签推文时充分考虑标签类别平衡的问题。

    一种基于时间增强的图神经网络会话推荐方法

    公开(公告)号:CN114186139B

    公开(公告)日:2022-08-16

    申请号:CN202111660113.0

    申请日:2021-12-30

    IPC分类号: G06F16/9535 G06N3/04 G06N3/08

    摘要: 本发明涉及互联网大数据技术领域,具体涉及一种基于时间增强的图神经网络会话推荐方法,其将目标会话输入经过训练的时间增强图神经网络模型中;时间增强图神经网络模型通过会话项目转换发生的时间间隔生成用户兴趣漂移程度,并构造能够根据用户兴趣漂移程度对应处理会话项目间转换关系的时间增强会话图,然后基于时间增强会话图学习项目嵌入并生成新会话表示,最后基于新会话表示计算候选项目的概率分布,以完成会话推荐。本发明的会话推荐方法能够基于用户兴趣漂移程度提升项目嵌入的质量,从而能够提升会话推荐的准确性。

    基于主题指导和双全局注意力的会话推荐方法

    公开(公告)号:CN113935811A

    公开(公告)日:2022-01-14

    申请号:CN202111247515.8

    申请日:2021-10-26

    发明人: 朱小飞 唐顾

    摘要: 本发明涉及互联网大数据技术领域,具体涉及一种基于主题指导和双全局注意力的会话推荐方法,其首先,基于注意力机制从目标会话文本的不同角度提取包含体现共现关系的显式全局嵌入表示和体现语义关系的隐式全局嵌入表示的全局嵌入表示;然后,从目标会话文本中提取对应的主题嵌入表示;最后,基于主题嵌入表示指导全局嵌入表示进行预测,以生成最终预测概率分布,并基于最终预测概率分布进行商品推荐。本发明中基于主题指导和双全局注意力的会话推荐方法能够兼顾商品分布概率预测的全面性和准确性。

    基于双通道知识蒸馏的节点分类方法

    公开(公告)号:CN113869425A

    公开(公告)日:2021-12-31

    申请号:CN202111151759.6

    申请日:2021-09-29

    发明人: 朱小飞 王新生

    摘要: 本发明涉及半监督节点分类技术领域,具体涉及一种基于双通道知识蒸馏的节点分类方法,其设置双通道教师模型和对应的学生模型;在训练时,双通道教师模型分别学习空间拓扑结构的知识信息和节点及邻居节点特征属性的知识信息,并基于两种知识信息所对应的知识层面指导学生模型训练,以使得学生模型保留基于结构的先验知识和基于特征的先验知识;在测试时,将经过训练的学生模型用于节点分类。本发明中基于双通道知识蒸馏的节点分类方法能够提高学生模型知识全面性和分类准确性,从而辅助提升节点分类的分类效果。

    基于强化依赖图的方面情感分类方法

    公开(公告)号:CN113869034A

    公开(公告)日:2021-12-31

    申请号:CN202111154191.3

    申请日:2021-09-29

    发明人: 朱小飞 宋红阳

    摘要: 本发明涉及方面情感分类技术领域,具体涉及基于强化依赖图的方面情感分类方法,包括:获取待分类评论文本;学习待分类评论文本的方面词信息和句法依赖关系,生成对应的强化依赖图;基于强化依赖图融合方面词信息与句法信息和远距离单词之间的依赖关系,然后计算每个上下文信息与方面词信息相关的注意力权重,并得到对应的文本最终表示;基于所述文本最终表示进行方面情感分类,并将对应的分类结果作为待分类评论文本的方面情感分类结果。本发明中的方面情感分类方法能够克服噪音信息影响并保证分类准确性,从而提高方面情感分类的效果。

    一种基于深度相关匹配模型的信息检索方法

    公开(公告)号:CN109189915B

    公开(公告)日:2021-10-15

    申请号:CN201811082554.5

    申请日:2018-09-17

    IPC分类号: G06F16/335 G06N3/08

    摘要: 本发明公开一种基于深度相关匹配模型的信息检索方法,包括如下步骤:获取检索词及文档的文档词;构建各个文档对应不同检索词的初始交互矩阵;使用具有检索维度的k‑max池化函数对各个初始交互矩阵降维得到各个文档对应不同检索词Top‑K交互矩阵;使用多层神经网络计算各个文档的Top‑K交互矩阵的检索得分;基于各个文档的检索得分的大小对各个文档进行排序,得到检索结果。本发明充分考虑了相似检索词的重要性,显著提高了检索的性能。

    基于源域数据增强与多兴趣细化迁移的跨域推荐方法

    公开(公告)号:CN117611273B

    公开(公告)日:2024-10-25

    申请号:CN202311400742.9

    申请日:2023-10-26

    发明人: 朱小飞 尹雅博

    IPC分类号: G06Q30/0601 G06F16/9535

    摘要: 本发明具体涉及基于源域数据增强与多兴趣细化迁移的跨域推荐方法,包括:通过跨域推荐模型输出冷启动用户对目标域候选商品的预测得分;处理步骤如下:筛选源域中潜在交互商品并进行去噪,生成辅助嵌入表示序列;对源域中真实商品交互嵌入序列和辅助嵌入表示序列进行兴趣提取;将冷启动用户的嵌入表示与多兴趣表示序列进行融合;对多兴趣偏好融合用户嵌入序列进行多兴趣细化;将多细化兴趣融合用户嵌入序列映射到目标域;计算每个冷启动用户的所有嵌入表示对目标域候选商品的预测得分并进行融合,生成冷启动用户对目标域候选商品的预测得分。本发明能够改善用户在源域中交互数据稀疏的问题,同时解决用户存在多个兴趣且兴趣之间关联的问题。