-
公开(公告)号:CN113467783B
公开(公告)日:2023-09-12
申请号:CN202110812211.5
申请日:2021-07-19
申请人: 中科曙光国际信息产业有限公司
摘要: 本发明实施例公开了一种人工智能加速器的核函数编译方法、装置、电子设备及存储介质,该方法包括:获取人工智能加速器的目标源码文件并解析,以获取至少一个深度学习段落;根据人工智能加速器的硬件结构参数、核函数性能参数以及深度学习段落的输入参数结构,获取至少一个配置参数组,并根据至少一个配置参数组和至少一个初始核函数,获取至少一个配置核函数;编译至少一个配置核函数,并获取至少一个配置核函数中运算速度最快的最优配置核函数。本发明实施例提供的技术方案,通过代码扫描及后台的代码编译运行,完成深度学习操作的最优配置核函数的获取,极大地减少了AI加速器针对深度学习训练的编译时长,提高了AI加速器的计算效率。
-
公开(公告)号:CN113467783A
公开(公告)日:2021-10-01
申请号:CN202110812211.5
申请日:2021-07-19
申请人: 中科曙光国际信息产业有限公司
摘要: 本发明实施例公开了一种人工智能加速器的核函数编译方法、装置、电子设备及存储介质,该方法包括:获取人工智能加速器的目标源码文件并解析,以获取至少一个深度学习段落;根据人工智能加速器的硬件结构参数、核函数性能参数以及深度学习段落的输入参数结构,获取至少一个配置参数组,并根据至少一个配置参数组和至少一个初始核函数,获取至少一个配置核函数;编译至少一个配置核函数,并获取至少一个配置核函数中运算速度最快的最优配置核函数。本发明实施例提供的技术方案,通过代码扫描及后台的代码编译运行,完成深度学习操作的最优配置核函数的获取,极大地减少了AI加速器针对深度学习训练的编译时长,提高了AI加速器的计算效率。
-