发明公开
- 专利标题: 基于电力运检业务的大模型推理加速方法及系统
-
申请号: CN202311589328.7申请日: 2023-11-27
-
公开(公告)号: CN117611133A公开(公告)日: 2024-02-27
- 发明人: 赵常威 , 王署东 , 柯艳国 , 李坚林 , 钱宇骋 , 施雯 , 潘超 , 张强 , 黄伟民 , 谢铖 , 甄超 , 刘同阳 , 李森林
- 申请人: 国网安徽省电力有限公司电力科学研究院 , 国网智能电网研究院有限公司
- 申请人地址: 安徽省合肥市经济开发区紫云路299号
- 专利权人: 国网安徽省电力有限公司电力科学研究院,国网智能电网研究院有限公司
- 当前专利权人: 国网安徽省电力有限公司电力科学研究院,国网智能电网研究院有限公司
- 当前专利权人地址: 安徽省合肥市经济开发区紫云路299号
- 代理机构: 合肥市浩智运专利代理事务所
- 代理商 丁瑞瑞
- 主分类号: G06Q10/20
- IPC分类号: G06Q10/20 ; G06Q50/06 ; G06N3/0455 ; G06N3/0499 ; G06N3/08
摘要:
本发明提供基于电力运检业务的大模型推理加速方法及系统,方法包括:多任务请求的调度,该调度将多个请求拼成一个输入作为整体网络的输入,在生成式对话中,可以做到一次回答多个请求问题;GPT网络,包括:Transformer Attention和Feed Forward Network组成,在预训练电力设备运检业务模型的一次解码Decode后的解码过程中,采用CUDA算子调用所述kv_cache,以调整kv_cache的形状,据以处理得到重构GPT网络模型;利用贪心算法将GPT模型的输出转化为一个token或者一个字。本发明解决了管理操作工作量大、电力设备运检业务信息总结不便以及维护成本高的技术问题。