一种对用于问答的大语言模型进行样本筛选的方法及装置

Invention Grant

CN117493890B 一种对用于问答的大语言模型进行样本筛选的方法及装置有权

Please log in to see more content

Patent Title: 一种对用于问答的大语言模型进行样本筛选的方法及装置
Application No.: CN202410007433.3

Application Date: 2024-01-03
Publication No.: CN117493890B

Publication Date: 2024-05-31
Inventor: 刘学博 , 刘良鑫 , 张民
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Applicant Address: 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
Assignee: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Current Assignee: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Current Assignee Address: 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
Agency: 北京市广友专利事务所有限责任公司
Agent 张仲波
Main IPC: G06F18/214
IPC: G06F18/214 ; G06F16/332 ; G06F16/335 ; G06N5/04

Abstract:

本发明涉及文本处理技术领域，特别是指一种对用于问答的大语言模型进行样本筛选的方法及装置，方法包括：从样本数据集中筛选出特定样本，基于特定样本对待训练大语言模型进行训练，得到前置模型；基于样本数据集以及前置模型，得到样本数据集中的每个样本数据的多个不同评分，进而确定出每个样本数据的一致性分数以及自信度分数，进而确定每个样本数据的质量评估分数；基于质量评估分数，筛选出微调样本数据；基于微调样本数据，对待训练大语言模型进行训练，得到训练好的大语言模型；基于待回答的用户问题以及训练好的大语言模型，得到更加对齐人类偏好的问题回答。采用本发明，可以提升模型处理和预测的准确性，提高用户问题回答的准确性。

Public/Granted literature

CN117493890A 一种对用于问答的大语言模型进行样本筛选的方法及装置 Public/Granted day:2024-02-02

Information query

Chinese Patent Announcement Global Dossier Espacenet