-
公开(公告)号:CN117217233A
公开(公告)日:2023-12-12
申请号:CN202311266352.7
申请日:2023-09-27
申请人: 清华大学 , 科大讯飞股份有限公司
IPC分类号: G06F40/30 , G06F40/289 , G06F18/22 , G06N3/045 , G06N3/0442
摘要: 本发明提供一种文本纠正、文本纠正模型训练方法及装置,所述方法包括:确定待纠正的答案文本以及答案文本对应的提问文本,以及与提问文本关联的知识文本;将答案文本、提问文本以及知识文本输入至文本纠正模型,得到文本纠正模型输出的答案文本的文本纠正结果;文本纠正模型以最小化预测错误实体与错误实体标签之间的差异,以及最小化文本纠正预测结果与文本纠正标签之间的差异为目标训练。本发明提供的种文本纠正、文本纠正模型训练方法及装置,文本纠正模型是联合错误实体识别任务与文本纠正任务进行训练的,从而错误实体识别任务与文本纠正任务之间能够相互提供辅助增强信息,进一步提高文本纠正模型的文本纠正精度。