发明公开
- 专利标题: 一种科技文献大语言模型的性能评估方法
-
申请号: CN202410610383.8申请日: 2024-05-16
-
公开(公告)号: CN118349818A公开(公告)日: 2024-07-16
- 发明人: 陆启宇 , 华珉 , 华斌 , 宋平 , 罗祾 , 齐晓曼 , 王琛
- 申请人: 国网上海市电力公司 , 上海久湛信息科技有限公司
- 申请人地址: 上海市浦东新区中国(上海)自由贸易试验区源深路1122号;
- 专利权人: 国网上海市电力公司,上海久湛信息科技有限公司
- 当前专利权人: 国网上海市电力公司,上海久湛信息科技有限公司
- 当前专利权人地址: 上海市浦东新区中国(上海)自由贸易试验区源深路1122号;
- 代理机构: 上海正择创一知识产权代理有限公司
- 代理商 郝科名
- 主分类号: G06F18/21
- IPC分类号: G06F18/21 ; G06F18/27 ; G06F16/35 ; G06F40/30 ; G06F40/284 ; G06F40/242 ; G06N5/04 ; G06N3/0455 ; G06N3/0442 ; G06N3/084
摘要:
本发明涉及一种科技文献大语言模型的性能评估方法,属于自然语言技术领域。其中,该方法包括:获取语言模型的模型参数并预设测试集,运行语言模型得到模型输出结果;提取模型输出结果的语义特征,根据模型参数得到基于模型输出的标准结构数据,通过标准结构数据建立映射关系集;对映射关系集进行结构完整性检验得到信息完整性评价因子;以回复信息数据和解释信息数据的语义特征为基础,对语义特征进行增强处理,将增强后的语义特征向量输入到回归模型中得到内容评估分数;通过信息完整性评价因子和内容评估分数对模型性能进行综合评价。提高了模型性能评估的适应性,完善了模型性能校验的测试技术。