基于电力运检业务的大模型推理加速方法及系统

发明公开

CN117611133A 基于电力运检业务的大模型推理加速方法及系统审中-实审

请登陆查看更多内容

专利标题： 基于电力运检业务的大模型推理加速方法及系统
申请号： CN202311589328.7

申请日： 2023-11-27
公开(公告)号： CN117611133A

公开(公告)日： 2024-02-27
发明人: 赵常威 , 王署东 , 柯艳国 , 李坚林 , 钱宇骋 , 施雯 , 潘超 , 张强 , 黄伟民 , 谢铖 , 甄超 , 刘同阳 , 李森林
申请人： 国网安徽省电力有限公司电力科学研究院 , 国网智能电网研究院有限公司
申请人地址： 安徽省合肥市经济开发区紫云路299号
专利权人： 国网安徽省电力有限公司电力科学研究院,国网智能电网研究院有限公司
当前专利权人： 国网安徽省电力有限公司电力科学研究院,国网智能电网研究院有限公司
当前专利权人地址： 安徽省合肥市经济开发区紫云路299号
代理机构： 合肥市浩智运专利代理事务所
代理商 丁瑞瑞
主分类号： G06Q10/20
IPC分类号： G06Q10/20 ; G06Q50/06 ; G06N3/0455 ; G06N3/0499 ; G06N3/08

摘要：

本发明提供基于电力运检业务的大模型推理加速方法及系统，方法包括：多任务请求的调度，该调度将多个请求拼成一个输入作为整体网络的输入，在生成式对话中，可以做到一次回答多个请求问题；GPT网络，包括：Transformer Attention和Feed Forward Network组成，在预训练电力设备运检业务模型的一次解码Decode后的解码过程中，采用CUDA算子调用所述kv_cache，以调整kv_cache的形状，据以处理得到重构GPT网络模型；利用贪心算法将GPT模型的输出转化为一个token或者一个字。本发明解决了管理操作工作量大、电力设备运检业务信息总结不便以及维护成本高的技术问题。

信息查询

中国专利公布公告 Global Dossier Espacenet