- 专利标题: 用于输出信息的方法、装置、设备以及存储介质
-
申请号: CN202010277015.8申请日: 2020-04-10
-
公开(公告)号: CN111522944B公开(公告)日: 2023-11-14
- 发明人: 戴松泰 , 冯欣伟 , 余淼 , 周环宇 , 宋勋超 , 袁鹏程
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京英赛嘉华知识产权代理有限责任公司
- 代理商 王达佐; 马晓亚
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/216 ; G06F40/295 ; G06F40/30
摘要:
本申请公开了用于输出信息的方法、装置、设备以及存储介质,涉及知识图谱技术领域。具体实现方案为:获取输入文本集合和任务信息集合,其中,输入文本集合中的单个输入文本与任务信息集合中的单个任务信息存在对应关系;获取与输入文本集合中输入文本相关的参考文本;将单个输入文本、与上述单个输入文本相关的参考文本以及与上述单个输入文本对应的任务信息,作为单个训练样本,得到训练样本集合;利用训练样本集合对预设的语言模型进行预训练和微调,得到目标语言模型;输出目标语言模型。本实现方式可以利用与各输入文本相关的参考文本对语言模型进行预训练和微调,提高了语言模型对外部知识的利用率,提高了语言模型对文本的理解能力。
公开/授权文献
- CN111522944A 用于输出信息的方法、装置、设备以及存储介质 公开/授权日:2020-08-11