一种科技文献大语言模型的性能评估方法

发明公开

CN118349818A 一种科技文献大语言模型的性能评估方法审中-实审

请登陆查看更多内容

专利标题： 一种科技文献大语言模型的性能评估方法
申请号： CN202410610383.8

申请日： 2024-05-16
公开(公告)号： CN118349818A

公开(公告)日： 2024-07-16
发明人: 陆启宇 , 华珉 , 华斌 , 宋平 , 罗祾 , 齐晓曼 , 王琛
申请人： 国网上海市电力公司 , 上海久湛信息科技有限公司
申请人地址： 上海市浦东新区中国(上海)自由贸易试验区源深路1122号;
专利权人： 国网上海市电力公司,上海久湛信息科技有限公司
当前专利权人： 国网上海市电力公司,上海久湛信息科技有限公司
当前专利权人地址： 上海市浦东新区中国(上海)自由贸易试验区源深路1122号;
代理机构： 上海正择创一知识产权代理有限公司
代理商 郝科名
主分类号： G06F18/21
IPC分类号： G06F18/21 ; G06F18/27 ; G06F16/35 ; G06F40/30 ; G06F40/284 ; G06F40/242 ; G06N5/04 ; G06N3/0455 ; G06N3/0442 ; G06N3/084

摘要：

本发明涉及一种科技文献大语言模型的性能评估方法，属于自然语言技术领域。其中，该方法包括：获取语言模型的模型参数并预设测试集，运行语言模型得到模型输出结果；提取模型输出结果的语义特征，根据模型参数得到基于模型输出的标准结构数据，通过标准结构数据建立映射关系集；对映射关系集进行结构完整性检验得到信息完整性评价因子；以回复信息数据和解释信息数据的语义特征为基础，对语义特征进行增强处理，将增强后的语义特征向量输入到回归模型中得到内容评估分数；通过信息完整性评价因子和内容评估分数对模型性能进行综合评价。提高了模型性能评估的适应性，完善了模型性能校验的测试技术。

信息查询

中国专利公布公告 Global Dossier Espacenet