发明公开
- 专利标题: 用于生成自然语言模型的方法和装置
-
申请号: CN202010440926.8申请日: 2020-05-22
-
公开(公告)号: CN111611808A公开(公告)日: 2020-09-01
- 发明人: 何烩烩 , 王乐义 , 安思宇 , 刘明浩 , 郭江亮 , 李旭
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京英赛嘉华知识产权代理有限责任公司
- 代理商 王达佐; 马晓亚
- 主分类号: G06F40/30
- IPC分类号: G06F40/30 ; G06K9/62 ; G06N3/04 ; G06N3/08
摘要:
本申请公开了用于生成自然语言模型的方法和装置,涉及人工智能技术领域。具体实现方案为:基于目标任务,确定教师任务,其中,目标任务用于预测文本与细粒度分类结果的对应关系,教师任务用于预测文本与粗粒度分类结果的对应关系;构建自然语言模型,其中,自然语言模型包括用于训练目标任务的目标任务模型和用于训练教师任务的教师任务模型;利用预设的文本训练样本集合训练自然语言模型,以使目标任务模型和教师任务模型交互学习,其中,文本训练样本包括标注有细粒度分类结果的文本样本。该实现方式使得训练得到自然语言模型的对细粒度分类结果预测更加准确,提高了生成的自然语言模型的预测性能。
公开/授权文献
- CN111611808B 用于生成自然语言模型的方法和装置 公开/授权日:2023-08-01