结合大语言模型的训练样本构建方法、系统、设备及介质
摘要:
本发明属于大数据技术领域,为了解决问法训练样本数据少的问题,提出了结合大语言模型的训练样本构建方法、系统、设备及介质,通过利用所获取的库表结构化知识数据构建Prompt模板,所述Prompt模板中库表结构和库表中知识数据相对应;根据所构建的Prompt模板,基于第一大语言模型得到包含问法和查询意图的推理结果;对所得到的推理结果构建扩充问法清单,并对所述扩充问法清单基于第二大语言模型获取问句中关键信息的预标注结果;将所述扩充问法清单以及对应的预标注结果作为问法训练数据用于训练问答模型,帮助在模板生成SQL方案中解决问法训练数据不足,以及扩充问法标注耗时导致方案可实施性降低的难题。
0/0