-
-
公开(公告)号:CN118394348B
公开(公告)日:2024-10-22
申请号:CN202410853484.8
申请日:2024-06-28
申请人: 浪潮电子信息产业股份有限公司
摘要: 本发明公开了一种算子调度方法、装置、设备及计算机可读存储介质,涉及深度学习技术领域,包括:获取当前深度学习框架中包含的各待调度算子和计算逻辑;从后端算子库中查找各待调度算子;利用高级语言表达式根据计算逻辑对各待调度算子进行组合,得到目标表达式;利用执行引擎对目标表达式进行解析,得到解析结果;根据解析结果利用预设通用函数接口对各待调度算子进行调度,以对当前深度学习框架的输入数据进行计算处理。应用本发明所提供的算子调度方法,解决了目前的算子调度方法维护的复杂性高,开发工作量高,算子调度效率低等问题,减少了算子间调用的差异性,简化了算子的使用和维护,提升了深度学习框架后端算子的调用效率。
-
公开(公告)号:CN118410851B
公开(公告)日:2024-10-15
申请号:CN202410882266.7
申请日:2024-07-03
申请人: 浪潮电子信息产业股份有限公司
IPC分类号: G06N3/08 , G06N3/042 , G06N3/0455
摘要: 本发明公开一种混合专家模型路由网络优化方法、产品、装置及介质,涉及语言模型训练技术领域,针对混合专家模型在实际应用中的负载不均衡问题,提供一种混合专家模型路由网络优化方法。本方案可以保证各专家网络具有最基础的语言理解能力,并将数据集进行分解,根据数据特征动态选择激活的专家网络,从而针对性的选取部分样本数据对特定专家模型进行迭代训练,从根本上解决由于负载不均衡导致某些专家网络无法得到有效训练的问题,以增加训练过程的灵活性,提升模型整体的训练性能,可以更好地应用于下游任务。
-
公开(公告)号:CN118586448B
公开(公告)日:2024-10-11
申请号:CN202411074251.4
申请日:2024-08-07
申请人: 浪潮电子信息产业股份有限公司
IPC分类号: G06N3/0455 , G06N3/084 , G06N3/082 , G06N3/0985 , G06N5/04 , G06F40/205 , G06F16/35
摘要: 本发明公开了一种文本任务处理方法及其模型训练方法、设备、介质、产品,应用于人工智能技术领域。其中,方法包括获取微调文本数据集和预训练好的初始语言模型。按照多个频率基准值对各微调文本样本的位置编码信息维度进行划分,并对不同组的位置编码信息采用相匹配的插值方法进行插值处理,以得到具有处理目标长度文本数据的过渡语言模型。基于目标长度设置窗口标记长度参数值和最大允许距离参数值,并基于推理文本长度设置目标文本长度参数值,利用窗口掩码方法对过渡语言模型进行外推处理,得到文本任务处理模型。本发明可以解决相关技术由于失去对长文本全局理解的能力导致性能下降的问题,能够有效提高长文本任务的执行精度。
-
公开(公告)号:CN118467031B
公开(公告)日:2024-10-01
申请号:CN202410924960.0
申请日:2024-07-11
申请人: 浪潮电子信息产业股份有限公司
IPC分类号: G06F8/73
摘要: 本发明公开了一种依赖包引入方法、产品、设备及介质,涉及软件开发技术领域。本方案将大量琐碎的依赖包整合为一个依赖供应商文件,相比于传统的npm工具和node_modules文件夹管理依赖包的方式,本方案能够在前端项目的依赖包引入中,极大地减小依赖包占用的本地磁盘大小;同时,在依赖供应商文件生成过程中,对其中的每个目标依赖包仅保留前端项目所需的目标功能,进一步减小了依赖供应商文件的体积,降低了本地开发环境的文件检索开销,极大地提升了本地开发环境的性能,提高了开发效率。
-
公开(公告)号:CN118467709B
公开(公告)日:2024-09-24
申请号:CN202410924966.8
申请日:2024-07-11
申请人: 浪潮电子信息产业股份有限公司
IPC分类号: G06F16/332 , G06F18/214 , G06F18/25 , G06V10/774 , G06V10/80
摘要: 本发明涉及人工智能技术领域,具体公开了视觉问答任务的评价方法、设备、介质及计算机程序产品,通过将包括问题数据和视觉模态数据的第一多模态数据输入目标视觉问答模型得到生成答案数据,将包括生成答案数据、问题数据、评价任务提示词和视觉模态数据的第二多模态数据输入预训练模型,该评价任务提示词携带评价任务信息和评价标准,以使预训练模型对生成答案数据进行准确性评价并给出推理过程数据,提高了对目标视觉问答模型的质量评价结果的可解释性和可靠性,有助于获得更准确的模型质量评价结果,通过将据此检验过质量合格的目标视觉问答模型部署于目标设备,保障了目标视觉问答模型在应用中的生成效果。
-
公开(公告)号:CN118394349B
公开(公告)日:2024-09-06
申请号:CN202410853487.1
申请日:2024-06-28
申请人: 浪潮电子信息产业股份有限公司
IPC分类号: G06F8/41 , G06F18/214 , G06F18/2431 , G06N20/00
摘要: 本申请公开了一种三方库接入方法、装置、设备、程序产品及介质,涉及计算机技术领域。该方法包括:获取预训练模型训练过程中使用的目标三方库,并对目标三方库进行梳理以分割出目标三方库中的计算模块;其中,计算模块用于实现各种算法的计算功能;确定接入目标三方库的深度学习框架类型,并根据深度学习框架类型,将计算模块中的计算逻辑分解为基于人工智能算力框架执行的目标算子;人工智能算力框架为用于实现人工智能算法的计算框架;利用人工智能算力框架调用目标算子以完成目标三方库的接入,并基于人工智能算力框架与目标三方库对接异构硬件设备。通过本申请的技术方案,可以缩减三方库接入流程,有效提高三方库接入效率。
-
公开(公告)号:CN118586477A
公开(公告)日:2024-09-03
申请号:CN202410867704.2
申请日:2024-06-30
申请人: 浪潮电子信息产业股份有限公司
摘要: 本发明涉及计算机技术领域,公开了一种多元异构算力适配方法、装置、设备、介质及产品,该方法包括:采用框架统一接口对接目标深度学习框架的调用接口;利用目标深度学习框架对深度学习模型相关的算子进行注册,并采用第一算子统一接口对算子基础化,将基础化后的算子信息传输至第二算子统一接口;采用第二算子统一接口对接算子库的接口,向算子库中导入基础化后的算子信息;根据算子库中的算子信息,对多元异构人工智能芯片进行适配与统一接入。这样可以实现框架与算力的垂直打通,进而实现多款不同的人工智能芯片的快速适配与统一接入,提高了目标深度学习框架在不同人工智能芯片上的兼容性,节省了人力成本,降低了迁移难度。
-
公开(公告)号:CN118427159B
公开(公告)日:2024-09-03
申请号:CN202410889279.7
申请日:2024-07-04
申请人: 浪潮电子信息产业股份有限公司
摘要: 本发明公开一种预训练模型文件管理方法、程序产品、装置及介质,涉及文件管理技术领域,用于实现模型文件管理,针对传统方案不支持文件断点续传的问题,提供了一种预训练模型文件管理方法,通过将文件分片传输,并在本地实时记录上传进度,当出现异常后重新上传文件时,可从断点数据块处重新进行上传,无需从头上传,可以有效地解决大模型文件的断点续传问题,避免大文件无法从中断处继续下载而严重影响效率和数据处理能力。并且,本方案实现的断点续传功能可直接部署在上传文件的客户端本地,通过额外设置的数据库文件即可实现,无需额外部署下载工具,也无需考虑到下载工具与管理系统之间的适配等问题,更易实施。
-
公开(公告)号:CN118378727B
公开(公告)日:2024-09-03
申请号:CN202410834403.X
申请日:2024-06-26
申请人: 浪潮电子信息产业股份有限公司
摘要: 本发明公开了一种基于混合精度的数据处理方法、系统、产品、设备及介质,涉及人工智能领域,为解决深度学习框架和计算设备适配效率低的问题,该方法包括获取目标计算设备对应的硬件黑白名单;利用目标深度学习框架分析预设模型得到多个当前算子;根据多个当前算子的标准名称和硬件黑白名单确定多个当前算子的执行精度;控制目标计算设备按执行算子的执行精度对输入数据进行算子计算。本发明将各个深度学习框架中下的算子名称进行统一,减少不同深度学习框架下的算子名称的二义性,以硬件算子黑白名单为基准取代各个深度学习框架中的黑白名单,实现各深度学习框架间的统一,从而降低深度学习框架和计算设备的适配难度,降低维护成本。
-
-
-
-
-
-
-
-
-