基于大语言模型生成思维链解释进行训练的事件抽取方法
摘要:
本发明公开了一种基于大语言模型生成思维链解释进行训练的事件抽取方法,属于事件抽取技术领域,包括:构建提示语句模板;基于上下文学习方法使用提示语句模板构造输入导入至大语言模型中,生成思维链风格的解释,基于思维链风格的解释生成带解释的数据集;微调小语言模型,通过带解释的数据集对小语言模型进行训练,获得轻量语言模型;对轻量语言模型进行测试,构建复筛模块;将复筛模块和轻量语言模型进行结合,生成事件抽取模型,基于事件抽取模型进行事件抽取。本发明解决了目前事件抽取方法不能对结果进行解释的问题,能够让事件抽取模型拥有输出解释和推理的能力,同时也拥有高于业界主流事件抽取方法的性能。
0/0