自然语言处理模型的训练方法、文本处理方法和装置

发明授权

CN114330281B 自然语言处理模型的训练方法、文本处理方法和装置有权

请登陆查看更多内容

专利标题： 自然语言处理模型的训练方法、文本处理方法和装置
申请号： CN202210218846.7

申请日： 2022-03-08
公开(公告)号： CN114330281B

公开(公告)日： 2022-06-07
发明人: 冀潮 , 姜博然 , 沈鸿翔 , 张振中 , 欧歌 , 钟楚千 , 魏书琪 , 张鹏飞
申请人： 北京京东方技术开发有限公司 , 京东方科技集团股份有限公司
申请人地址： 北京市北京经济技术开发区地泽路9号1幢407室;
专利权人： 北京京东方技术开发有限公司,京东方科技集团股份有限公司
当前专利权人： 北京京东方技术开发有限公司,京东方科技集团股份有限公司
当前专利权人地址： 北京市北京经济技术开发区地泽路9号1幢407室;
代理机构： 北京博思佳知识产权代理有限公司
代理商 杨凯程
主分类号： G06F40/20
IPC分类号： G06F40/20 ; G06N3/04 ; G06N3/08

摘要：

本公开涉及自然语言处理模型的训练方法，包括获取样本文本；确定所述样本文本中的三元组，所述三元组包括所述样本文本中的两个实体和所述两个实体之间的关系；基于所述三元组对所述样本文本进行处理以得到知识融合向量；将所述知识融合向量输入自然语言处理模型进行训练得到目标模型。根据本公开，可以基于样本文本中的三元组对样本文本进行处理得到知识融合向量，相对于样本文本，知识融合向量包含了样本文本信息本身之外的其他三元组信息，如文本中的实体信息、实体之间的关系信息，从而更加准确地让计算机获取到样本文本的真实含义，因此基于知识融合向量对自然语言处理模型进行训练得到的目标模型，对于自然语言处理的效果更好。

公开/授权文献

CN114330281A 自然语言处理模型的训练方法、文本处理方法和装置公开/授权日：2022-04-12

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/20	.自然语言分析（自然语言的语义分析入G06F40/30）