-
公开(公告)号:CN115329940A
公开(公告)日:2022-11-11
申请号:CN202211020768.6
申请日:2022-08-24
申请人: 中科曙光国际信息产业有限公司
摘要: 本发明公开了一种卷积算法的推荐方法、装置、设备及存储介质,包括:获取待处理的目标参数组向量,确定目标参数组向量在不同备选卷积算法下对应的目标特征向量;获取与各备选卷积算法对应的性能刻度表,根据目标特征向量与各性能刻度表中存储的各特征向量之间的相似度,确定目标参数组向量在不同备选卷积算法下对应的目标性能;根据目标参数组向量在不同备选卷积算法下对应的目标性能,确定与目标参数组向量对应的卷积算法推荐结果。本发明实施例的技术方案可以提高卷积算法的推荐效率,以及卷积算法推荐结果的鲁棒性。
-
公开(公告)号:CN117236423A
公开(公告)日:2023-12-15
申请号:CN202311269515.7
申请日:2023-09-27
申请人: 中科曙光国际信息产业有限公司
摘要: 本申请涉及一种核函数调用方法、装置、设备、存储介质和程序产品。所述方法包括:获取问题描述信息,所述问题描述信息包括测试问题描述信息;根据所述问题描述信息,获取所述问题描述信息对应的目标核函数,其中,所述目标核函数包括主机端管理接口函数,所述目标核函数是根据所述主机端管理接口函数确定的;根据所述问题描述信息以及所述主机端管理接口函数,调用所述目标核函数,以响应所述问题描述信息。采用本方法能够提升核函数测试效率,改善异构并行库的长尾问题。
-
公开(公告)号:CN113467783B
公开(公告)日:2023-09-12
申请号:CN202110812211.5
申请日:2021-07-19
申请人: 中科曙光国际信息产业有限公司
摘要: 本发明实施例公开了一种人工智能加速器的核函数编译方法、装置、电子设备及存储介质,该方法包括:获取人工智能加速器的目标源码文件并解析,以获取至少一个深度学习段落;根据人工智能加速器的硬件结构参数、核函数性能参数以及深度学习段落的输入参数结构,获取至少一个配置参数组,并根据至少一个配置参数组和至少一个初始核函数,获取至少一个配置核函数;编译至少一个配置核函数,并获取至少一个配置核函数中运算速度最快的最优配置核函数。本发明实施例提供的技术方案,通过代码扫描及后台的代码编译运行,完成深度学习操作的最优配置核函数的获取,极大地减少了AI加速器针对深度学习训练的编译时长,提高了AI加速器的计算效率。
-
公开(公告)号:CN113467783A
公开(公告)日:2021-10-01
申请号:CN202110812211.5
申请日:2021-07-19
申请人: 中科曙光国际信息产业有限公司
摘要: 本发明实施例公开了一种人工智能加速器的核函数编译方法、装置、电子设备及存储介质,该方法包括:获取人工智能加速器的目标源码文件并解析,以获取至少一个深度学习段落;根据人工智能加速器的硬件结构参数、核函数性能参数以及深度学习段落的输入参数结构,获取至少一个配置参数组,并根据至少一个配置参数组和至少一个初始核函数,获取至少一个配置核函数;编译至少一个配置核函数,并获取至少一个配置核函数中运算速度最快的最优配置核函数。本发明实施例提供的技术方案,通过代码扫描及后台的代码编译运行,完成深度学习操作的最优配置核函数的获取,极大地减少了AI加速器针对深度学习训练的编译时长,提高了AI加速器的计算效率。
-
-
-