发明公开
- 专利标题: 基于大语言模型生成思维链解释进行训练的事件抽取方法
-
申请号: CN202410723413.6申请日: 2024-06-05
-
公开(公告)号: CN118467737A公开(公告)日: 2024-08-09
- 发明人: 于艳华 , 王远龙 , 马云山 , 秦汐婷
- 申请人: 北京邮电大学
- 申请人地址: 北京市海淀区西土城路10号
- 专利权人: 北京邮电大学
- 当前专利权人: 北京邮电大学
- 当前专利权人地址: 北京市海淀区西土城路10号
- 代理机构: 北京盛询知识产权代理有限公司
- 代理商 徐杰
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/30 ; G06N3/0455 ; G06N3/09 ; G06N5/045
摘要:
本发明公开了一种基于大语言模型生成思维链解释进行训练的事件抽取方法,属于事件抽取技术领域,包括:构建提示语句模板;基于上下文学习方法使用提示语句模板构造输入导入至大语言模型中,生成思维链风格的解释,基于思维链风格的解释生成带解释的数据集;微调小语言模型,通过带解释的数据集对小语言模型进行训练,获得轻量语言模型;对轻量语言模型进行测试,构建复筛模块;将复筛模块和轻量语言模型进行结合,生成事件抽取模型,基于事件抽取模型进行事件抽取。本发明解决了目前事件抽取方法不能对结果进行解释的问题,能够让事件抽取模型拥有输出解释和推理的能力,同时也拥有高于业界主流事件抽取方法的性能。