一种基于逆强化学习自动调整奖励的文本摘要系统

    公开(公告)号:CN116522897A

    公开(公告)日:2023-08-01

    申请号:CN202310281938.4

    申请日:2023-03-22

    申请人: 天津大学

    IPC分类号: G06F40/20 G06N3/04 G06N3/092

    摘要: 本发明公开了一种基于逆强化学习自动调整奖励的文本摘要系统,所述系统包括摘要模型、奖励模块、策略模块和人工摘要模型,所述摘要模型提取原始文档数据采用逆强化算法生成文本摘要函数Y;所述奖励模块对文本摘要函数更新不同奖励的权重;所述策略模块采用如下公式对文本摘要函数进行混合奖励函数的训练;所述人工摘要模块通过评价指标对训练后文本摘要函数进行最终奖励输出最优文本摘要模型;本发明将逆强化学习训练文本摘要领域,克服现有技术中训练目标不匹配、暴露偏差的技术问题,提高人工智能生成文本摘要的精准性。