基于多语言的阅读理解任务识别方法及装置

    公开(公告)号:CN112182151A

    公开(公告)日:2021-01-05

    申请号:CN202011012758.9

    申请日:2020-09-23

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种基于多语言的阅读理解任务识别方法及装置,该方法包括:获取任一目标语言的阅读理解任务数据,编码得到上下文嵌入表达向量;将所述嵌入表达向量,输入预设的多语言阅读理解模型,根据多语言阅读理解模型的输出结果,确定阅读理解任务的答案;其中,所述多语言阅读理解模型,以源语言任务数据分别和每一目标语言任务数据的关联语义信息矩阵,进行融合后得到的特征向量作为输入,以源语言任务数据的答案作为标签,进行训练后得到。该方法能够同时支持迁移多语言和多任务数据集中的知识到目标语言中,实现目标语言无数据、少数据条件下的抽取式阅读理解任务,可以提高目标语言少数据以及富数据的抽取式阅读理解任务的准确度。

    一种专利空白预测方法及系统

    公开(公告)号:CN112100398A

    公开(公告)日:2020-12-18

    申请号:CN202010931215.0

    申请日:2020-09-07

    Applicant: 清华大学

    Abstract: 本发明实施例提供一种专利空白预测方法及系统,包括:获取预设时间段内的历史专利,生成历史文本文件;提取历史文本文件中的实体和各实体之间的关系;将实体作为节点,将关系作为边,构建专利知识图谱;在专利知识图谱中预测未连边的两个节点间所存在的潜在边,以构建新的专利知识图谱;根据新的专利知识图谱,获取目标预测专利。本发明实施例提供的专利空白预测方法及系统,利用历史专利文档数据中的实体和关系构建专利知识图谱,通过图神经网络算法来预测专利知识图谱中潜在的三元组,以实现空白专利的预测,为明确科技研究方向与新专利的申报方向提供了便捷的途径。

    一种基于表示学习的知识库实体分类的计算方法

    公开(公告)号:CN107545033B

    公开(公告)日:2020-12-01

    申请号:CN201710608234.8

    申请日:2017-07-24

    Applicant: 清华大学

    Abstract: 本发明涉及一种基于表示学习的知识库实体分类的计算装置,涉及文本分类和知识库补全领域。所述方法包括步骤:对于知识库中的实体,构造包含不同层次信息的共现网络,将词语‑词语,实体‑词语,类别‑词语,实体‑类别之间的共现信息编码到网络中;基于构造的共现网络,利用基于网络的表示学习方法,学习实体和类别的向量表示;基于学习得到的向量表示,利用学习排序算法,为实体和类别学习映射矩阵,语义上相关的实体和类别在语义空间中接近;利用自顶向下的搜索方法,为知识库中的实体自动分配类别,得到一条类别的路径。本发明方法有利于解决现有实体分类方法中存在的问题。

    事件检测模型的构建方法、装置、电子设备及存储介质

    公开(公告)号:CN111813931A

    公开(公告)日:2020-10-23

    申请号:CN202010548917.0

    申请日:2020-06-16

    Applicant: 清华大学

    Abstract: 本发明实施例提供了一种基于开放域知识增强的事件检测深度学习模型的构建方法、装置、电子设备及存储介质,方法包括:获取标注数据和未标注数据;将标注数据输入到第一事件分类模型中,进行训练;根据外部语义库采用义原映射算法,对未标注数据中的第一数据子集进行处理,得到开放域触发词识别结果;根据开放域触发词识别结果和第二数据子集,采用知识蒸馏的方式,对第二事件分类模型进行训练;对训练后的第一事件分类模型和训练后的第二事件分类模型进行联合训练,得到基于开放域知识增强的事件检测深度学习模型。本发明实施例得到的基于开放域知识增强的事件检测深度学习模型可以有效解决各类标注分布不均匀的长尾难题。

    一种基于表示学习的知识库实体分类的计算方法

    公开(公告)号:CN107545033A

    公开(公告)日:2018-01-05

    申请号:CN201710608234.8

    申请日:2017-07-24

    Applicant: 清华大学

    Abstract: 本发明涉及一种基于表示学习的知识库实体分类的计算装置,涉及文本分类和知识库补全领域。所述方法包括步骤:对于知识库中的实体,构造包含不同层次信息的共现网络,将词语-词语,实体-词语,类别-词语,实体-类别之间的共现信息编码到网络中;基于构造的共现网络,利用基于网络的表示学习方法,学习实体和类别的向量表示;基于学习得到的向量表示,利用学习排序算法,为实体和类别学习映射矩阵,语义上相关的实体和类别在语义空间中接近;利用自顶向下的搜索方法,为知识库中的实体自动分配类别,得到一条类别的路径。本发明方法有利于解决现有实体分类方法中存在的问题。

    一种多策略组合的本体或实例匹配方法

    公开(公告)号:CN102306177A

    公开(公告)日:2012-01-04

    申请号:CN201110247261.X

    申请日:2011-08-25

    Applicant: 清华大学

    Abstract: 本发明公开了一种多策略组合的本体或实例匹配方法,涉及语义万维网领域。所述方法包括步骤:对于两个本体元素或两个实例元素集合,基于本体元素或实例元素的不同文本信息执行多个匹配策略,得到多组匹配结果,对所述多组匹配结果中的每个匹配结果进行投票,根据投票结果对所述多组匹配结果进行过滤,得到初始匹配结果;根据所述初始匹配结果,以及本体元素或者实例元素之间的链接关系,获得新匹配结果,所述初始匹配结果和所述新匹配结果合并后得到最终匹配结果。所述方法提高了最终匹配结果的准确度,有利于更好的解决链接数据模式层和实例层的异构问题。

    知识图谱的查询语句生成方法、装置及电子设备

    公开(公告)号:CN119557328A

    公开(公告)日:2025-03-04

    申请号:CN202411539171.1

    申请日:2024-10-31

    Applicant: 清华大学

    Abstract: 本发明涉及知识图谱技术领域,提供一种知识图谱的查询语句生成方法、装置及电子设备,该知识图谱的查询语句生成方法包括:获取针对知识图谱的自然语言问句;根据自然语言问句与预先设置的问句模板生成大语言模型问句,问句模板用于引导大语言模型将自然语言问句转换为目标查询语言的语句;根据大语言模型问句向大语言模型提问,得到大语言模型输出的目标查询语言的初始语句;基于初始语句生成目标查询语言的查询语句。该方法提升了知识图谱查询语句的生成效率。

    一种基于大语言模型的问答方法及系统

    公开(公告)号:CN119166767A

    公开(公告)日:2024-12-20

    申请号:CN202411153889.7

    申请日:2024-08-21

    Applicant: 清华大学

    Abstract: 本发明提供一种基于大语言模型的问答方法及系统,该方法包括:确定用户的当前问题和自然语言理解提示词;输入当前问题和自然语言理解提示词至预训练大语言模型,获得大语言模型根据自然语言理解策略输出的问题理解结果和待回答问题;在问题理解结果为事实性问题的情况下,基于语义解析从知识图谱检索答案;输入检索答案和答案校验提示词至预训练大语言模型,得到答案校验结果;在校验合理的情况下,将检索答案作为当前问题的最终答案;在校验不合理的情况下,大语言模型生成答案。本发明在多轮问答任务中能够基于上下文深入理解用户的问题,有效检索和整合不用的知识源的信息,从而准确、高效地提供当前问题的答案。

    大模型多智能体驱动的自适应在线课堂构建方法及系统

    公开(公告)号:CN119067808A

    公开(公告)日:2024-12-03

    申请号:CN202410972551.8

    申请日:2024-07-19

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种大模型多智能体驱动的自适应在线课堂构建方法及系统,该方法包括:通过讲解脚本生成智能体根据教师上传的课程资料,生成基于讲解脚本的教育智能体控制语言;通过教师智能体根据教育智能体控制语言和自适应在线课堂中的上下文多轮对话,自动完成授课和自适应答疑;通过同学智能体根据上下文多轮对话,生成活跃课堂气氛的内容;通过导演智能体根据上下文多轮对话,控制在自适应在线课堂中展示的智能体生成内容。本发明使得自适应在线课堂中的所有角色由智能体扮演,兼顾在线学习场景中大规模与个性化的学习需求,同时满足与教师的充分交互和学习者的伴学需求,可以提高学生完课率和学习效果。

    动态更新的知识图谱扩展方法及装置

    公开(公告)号:CN112527924B

    公开(公告)日:2024-07-23

    申请号:CN202011507777.9

    申请日:2020-12-18

    Applicant: 清华大学

    Abstract: 本发明提供一种动态更新的知识图谱扩展方法及装置,所述方法包括:基于第一知识库,进行知识图谱的构建,生成目标领域的知识图谱,其中,所述第一知识库由目标领域的原始数据构成;基于所述目标领域的新知识,生成第二知识库,并将所述第二知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱;和/或,基于所述知识图谱,执行知识赋能操作,获得所述知识图谱的应用方案,并对所述应用方案执行知识推理操作,得到第三知识库,将所述第三知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱。本发明提供的动态更新的知识图谱扩展方法及装置,可以实现知识图谱的动态扩展,保证了知识图谱的动态更新和实时性。

Patent Agency Ranking