- 专利标题: 一种人工智能加速器的核函数编译方法和装置
-
申请号: CN202110812211.5申请日: 2021-07-19
-
公开(公告)号: CN113467783B公开(公告)日: 2023-09-12
- 发明人: 文进辉 , 胡辰卜 , 景德
- 申请人: 中科曙光国际信息产业有限公司
- 申请人地址: 山东省青岛市崂山区松岭路169号软件园A区211房间
- 专利权人: 中科曙光国际信息产业有限公司
- 当前专利权人: 中科曙光国际信息产业有限公司
- 当前专利权人地址: 山东省青岛市崂山区松岭路169号软件园A区211房间
- 代理机构: 北京品源专利代理有限公司
- 代理商 孔凡红
- 主分类号: G06F8/41
- IPC分类号: G06F8/41 ; G06N3/08
摘要:
本发明实施例公开了一种人工智能加速器的核函数编译方法、装置、电子设备及存储介质,该方法包括:获取人工智能加速器的目标源码文件并解析,以获取至少一个深度学习段落;根据人工智能加速器的硬件结构参数、核函数性能参数以及深度学习段落的输入参数结构,获取至少一个配置参数组,并根据至少一个配置参数组和至少一个初始核函数,获取至少一个配置核函数;编译至少一个配置核函数,并获取至少一个配置核函数中运算速度最快的最优配置核函数。本发明实施例提供的技术方案,通过代码扫描及后台的代码编译运行,完成深度学习操作的最优配置核函数的获取,极大地减少了AI加速器针对深度学习训练的编译时长,提高了AI加速器的计算效率。
公开/授权文献
- CN113467783A 一种人工智能加速器的核函数编译方法和装置 公开/授权日:2021-10-01