动态更新的知识图谱扩展方法及装置

    公开(公告)号:CN112527924B

    公开(公告)日:2024-07-23

    申请号:CN202011507777.9

    申请日:2020-12-18

    申请人: 清华大学

    IPC分类号: G06F16/28 G06F16/23

    摘要: 本发明提供一种动态更新的知识图谱扩展方法及装置,所述方法包括:基于第一知识库,进行知识图谱的构建,生成目标领域的知识图谱,其中,所述第一知识库由目标领域的原始数据构成;基于所述目标领域的新知识,生成第二知识库,并将所述第二知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱;和/或,基于所述知识图谱,执行知识赋能操作,获得所述知识图谱的应用方案,并对所述应用方案执行知识推理操作,得到第三知识库,将所述第三知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱。本发明提供的动态更新的知识图谱扩展方法及装置,可以实现知识图谱的动态扩展,保证了知识图谱的动态更新和实时性。

    在图神经网络中的自适应扩散
    43.
    发明公开

    公开(公告)号:CN118140231A

    公开(公告)日:2024-06-04

    申请号:CN202180103443.1

    申请日:2021-10-15

    IPC分类号: G06N3/082 G06N3/0442

    摘要: 公开了一种用于训练图神经网络(GNN)以学习用于消息传递的特征传播的邻域半径以执行节点分类的方法。所述方法包括:将训练集的数据输入到所述GNN中;至少部分地基于所述训练集的第一损失函数的降低来更新所述GNN的可训练参数,其中,所述可训练参数至少包括所述GNN的权重和偏置参数;至少部分地基于所述训练集的所述第一损失函数的所述降低来更新一个或多个邻域半径相关参数,其中,所述一个或多个邻域半径相关参数至少包括具有不同步离的所有邻居节点的影响权重,并且其中,所述GNN的每个层上所有邻居节点的所述影响权重之和等于1;以及基于经更新的一个或多个邻域半径相关参数来计算要在消息传递的所述特征传播中使用的所述邻域半径。提供了众多其它方面。

    基于理科题目解答任务的蒙特卡洛树搜索方法及装置

    公开(公告)号:CN117933392A

    公开(公告)日:2024-04-26

    申请号:CN202410065460.6

    申请日:2024-01-16

    申请人: 清华大学

    IPC分类号: G06N5/04 G06F18/214

    摘要: 本发明公开了基于理科题目解答任务的蒙特卡洛树搜索方法及装置,本发明方法,包括获取具有分步解答标注的理科题目数据集;将理科题目数据集输入至价值模型以利用逐步回归法进行价值模型训练,并利用蒙特卡洛树策略模型对每道题目进行搜索解答确定对应的搜索树以进行策略模型训练;其中,搜索树的树节点为若干推理步骤构成的针对理科题目的解答,树边为进行的单步推理步数;基于训练好的价值模型和训练好的蒙特卡洛树策略模型构建搜索模型;将实时理科题目数据输入至搜索模型以基于训练好的价值模型输出的节点状态价值评估结果进行树搜索得到数据搜索解答结果。本发明可以大幅提高模型在较难的大学理科题目解答的任务中的推理性能,有效解答。

    一种级联扩散方法
    45.
    发明公开

    公开(公告)号:CN117710217A

    公开(公告)日:2024-03-15

    申请号:CN202311718367.2

    申请日:2023-12-13

    申请人: 清华大学

    IPC分类号: G06T3/4076

    摘要: 本发明提出一种级联扩散方法,包括,获取低分辨率高斯噪声,通过标准扩散模型对低分辨率高斯噪声进行处理得到低分辨率图像;将低分辨率图像进行最邻近线性插值,得到模糊高分辨率图像;获取高分辨率高斯噪声,根据高分辨率高斯噪声构建块状噪声和高斯噪声的混合噪声;将模糊高分辨率图像加上混合噪声得到加噪模糊图像;将加噪模糊图像输入中继扩散模型,输出得到模糊高分辨率图像的条件概率分布梯度;通过模糊扩散利用条件概率分布梯度和混合噪声构建随机微分方程采样器;对加噪模糊图像通过随机微分方程采样器进行采样,得到清晰的高分辨率图像。本发明提出的方法,通过模糊扩散和块状噪声将低分辨率图像转为对应的高分辨率图像。

    基于非顺序反向提示的自动作诗方法

    公开(公告)号:CN117709323A

    公开(公告)日:2024-03-15

    申请号:CN202311716559.X

    申请日:2023-12-13

    申请人: 清华大学

    发明人: 唐杰 邹旭

    IPC分类号: G06F40/186

    摘要: 本发明提出一种基于非顺序反向提示的自动作诗方法,包括,获取诗歌的控制内容,其中,控制内容包括:诗歌标题、情感、格式;针对控制内容,使用非顺序反向提示‑优化法创作初始诗歌;使用非顺序反向提示‑重构法优化初始诗歌;输出优化后的诗歌。通过本发明提出的方法,可以大幅提升预训练语言模型诗歌生成的能力,生成质量极高的诗歌。

    常识增强的多轮对话应答排序方法和装置

    公开(公告)号:CN116628159A

    公开(公告)日:2023-08-22

    申请号:CN202310575292.0

    申请日:2023-05-19

    申请人: 清华大学

    摘要: 本发明公开了常识增强的多轮对话应答排序方法及装置,该方法包括基于第一对话数据对常识知识图谱进行知识抽取,以将抽取的实体作为上下文节点构建实体子图;将预处理后的第一对话数据和实体子图输入至应答网络模型,输出得到上下文节点的两个表征向量;将两个表征向量之间的相似度和基于应答网络模型输出得到的应答输出预测结果与应答输出真实结果的损失值作为目标函数对应答网络模型进行训练优化,以得到训练好的应答网络模型;将第二对话数据输入至训练好的应答网络模型进行多轮对话应答输出,并对多轮对话应答输出结果进行排序得到应答排序结果。本发明可以明显提升应答候选进行排序的效率。

    参数高效的动态社交网络中用户间关系预测方法及装置

    公开(公告)号:CN116523123A

    公开(公告)日:2023-08-01

    申请号:CN202310424079.X

    申请日:2023-04-19

    申请人: 清华大学

    摘要: 本发明公开了参数高效的动态社交网络中用户间关系预测方法及装置,该方法包括:基于用户特征矩阵构建包含训练集和测试集的静态子图;对根据训练集中的静态子图生成的随机时间窗口进行分割得到多个时间窗口;将每个静态子图输入至图神经网络模型中以计算帧级别损失和窗口感知损失,并根据帧级别损失梯度和窗口感知损失梯度的聚合结果优化图神经网络模型的模型参数得到训练好的神经网络模型;将测试集中的静态子图输入至训练好的神经网络模型得到动态社交网络中任意两个节点用户之间是否存在关系的匹配值,以根据匹配值得到用户间的关系预测结果。本发明能够捕获多个时间跨度范围下动态图信息,从而实现高效的动态社交网络中用户间关系预测。

    事件关系预测方法、装置、电子设备、介质及程序产品

    公开(公告)号:CN116501868A

    公开(公告)日:2023-07-28

    申请号:CN202310325479.5

    申请日:2023-03-29

    申请人: 清华大学

    摘要: 本发明实施例提供一种事件关系预测方法、装置、电子设备、介质及程序产品,该方法包括:对输入文本进行聚类得到多个互不相交的原始组;对原始组进行两两融合得到多个交叉组;利用摘要生成模型生成原始组的第一摘要及交叉组的第二摘要;分别获取输入文本、第一摘要及第二摘要中的事件的向量表示及事件对的向量表示;根据输入文本、第一摘要及第二摘要中事件对的向量表示获取待预测事件对的向量表示;将待预测事件对的向量表示输入至预训练的事件关系预测模型,输出待预测事件对的事件关系预测结果。本发明实施例有效提升了模型处理长距离事件关系预测的能力,减少事件关系预测过程中遇到的冗余信息的影响,提高了事件关系的预测效率和准确率。

    一种面向人类偏好的高效网络检索增强回答方法及系统

    公开(公告)号:CN116501843A

    公开(公告)日:2023-07-28

    申请号:CN202310165171.9

    申请日:2023-02-21

    申请人: 清华大学

    摘要: 本发明公开了一种面向人类偏好的高效网络检索增强回答方法及系统,该方法包括:利用预设的网络搜索引擎获取网络网页中与问题对应的候选答案;利用检索模型得到候选参考资料;通过语言模型的语境学习生成基于候选参考资料的问答数据集,将问答数据集中语言模型对候选参考资料的采用信息作为标签训练检索模型,并通过问答数据集微调语言模型,以通过训练好的语言模型根据候选参考资料生成问题答案;根据用户对问题答案的反馈数据建立人类偏好感知的评分器,以根据训练好的评分器得到所述问题答案的优化结果。本发明通过网络搜索与召回技术来增强预训练的语言模型,以实现真实场景下的应用部署,同时维持高系统效率与低部署成本。