发明公开
- 专利标题: 指令微调数据的生成方法、装置、设备及介质
-
申请号: CN202310827694.5申请日: 2023-07-07
-
公开(公告)号: CN116861928A公开(公告)日: 2023-10-10
- 发明人: 罗华刚 , 张杰 , 于皓 , 李犇 , 贾敬伍
- 申请人: 北京中关村科金技术有限公司
- 申请人地址: 北京市海淀区上地四街一号院5号楼一层130
- 专利权人: 北京中关村科金技术有限公司
- 当前专利权人: 北京中关村科金技术有限公司
- 当前专利权人地址: 北京市海淀区上地四街一号院5号楼一层130
- 代理机构: 北京银龙知识产权代理有限公司
- 代理商 廖晓岚
- 主分类号: G06F40/56
- IPC分类号: G06F40/56 ; G06N5/02
摘要:
本发明提供了一种指令微调数据的生成方法、装置、设备及介质,涉及自然语言处理技术领域。该方法包括:获取第一知识库和第一预设数量的种子任务;生成提示信息,所述提示信息包括:所述第一预设数量的种子任务、所述第一知识库以及预设的指令生成要求;根据所述提示信息和预设大语言模型,得到第一指令微调数据;对所述第一指令微调数据进行处理,得到第二指令微调数据。本发明通过引入知识库数据,提高了生成指令微调数据的质量,降低了噪音数据生成的概率。
公开/授权文献
- CN116861928B 指令微调数据的生成方法、装置、设备及介质 公开/授权日:2023-11-17