用于生成自然语言模型的方法和装置

发明公开

请登陆查看更多内容

专利标题： 用于生成自然语言模型的方法和装置
申请号： CN202010440926.8

申请日： 2020-05-22
公开(公告)号： CN111611808A

公开(公告)日： 2020-09-01
发明人: 何烩烩 , 王乐义 , 安思宇 , 刘明浩 , 郭江亮 , 李旭
申请人： 北京百度网讯科技有限公司
申请人地址： 北京市海淀区上地十街10号百度大厦2层
专利权人： 北京百度网讯科技有限公司
当前专利权人： 北京百度网讯科技有限公司
当前专利权人地址： 北京市海淀区上地十街10号百度大厦2层
代理机构： 北京英赛嘉华知识产权代理有限责任公司
代理商 王达佐; 马晓亚
主分类号： G06F40/30
IPC分类号： G06F40/30 ; G06K9/62 ; G06N3/04 ; G06N3/08

摘要：

本申请公开了用于生成自然语言模型的方法和装置，涉及人工智能技术领域。具体实现方案为：基于目标任务，确定教师任务，其中，目标任务用于预测文本与细粒度分类结果的对应关系，教师任务用于预测文本与粗粒度分类结果的对应关系；构建自然语言模型，其中，自然语言模型包括用于训练目标任务的目标任务模型和用于训练教师任务的教师任务模型；利用预设的文本训练样本集合训练自然语言模型，以使目标任务模型和教师任务模型交互学习，其中，文本训练样本包括标注有细粒度分类结果的文本样本。该实现方式使得训练得到自然语言模型的对细粒度分类结果预测更加准确，提高了生成的自然语言模型的预测性能。

公开/授权文献

CN111611808B 用于生成自然语言模型的方法和装置公开/授权日：2023-08-01

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F40/00	处理自然语言数据（语音分析或综合，语音识别G10L）
G06F40/30	.语义分析