Invention Publication
- Patent Title: 训练信息抽取模型和获取知识图谱的方法、装置和设备
-
Application No.: CN202010500623.0Application Date: 2020-06-04
-
Publication No.: CN111737552APublication Date: 2020-10-02
- Inventor: 陈玉博 , 刘康 , 赵军 , 曹鹏飞 , 闭玮 , 刘晓江 , 郑宇飞
- Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
- Applicant Address: 北京市海淀区中关村东路95#中国科学院自动化研究所
- Assignee: 中国科学院自动化研究所,腾讯科技(深圳)有限公司
- Current Assignee: 中国科学院自动化研究所,腾讯科技(深圳)有限公司
- Current Assignee Address: 北京市海淀区中关村东路95#中国科学院自动化研究所
- Agency: 北京同达信恒知识产权代理有限公司
- Agent 李娟
- Main IPC: G06F16/953
- IPC: G06F16/953 ; G06F16/36 ; G06F40/211 ; G06N20/00 ; G06N3/04

Abstract:
本申请涉及计算机技术领域,提供一种训练信息抽取模型和获取知识图谱的方法、装置和设备,用以提高信息抽取模型的鲁棒性。其中方法包括:对初始的第一信息抽取模型进行训练,基于对噪音样本的预测结果对第一信息抽取模型进行更新,得到第一中间态模型;基于第一中间态模型对噪音样本的预测结果与初始的第二信息抽取模型对非噪音样本的预测结果的差异对第一信息抽取模型进行更新,得到第二中间态模型;基于第二中间态模型对非噪音样本的预测结果对第二中间态模型进行更新,得到参考模型;基于预设平滑系数对参考模型的参数进行调整,得到目标信息抽取模型。本申请基于元学习的方式对模型参数进行更新,更新后的模型更鲁棒,构建的知识图谱更准确。
Information query