一种基于异构边缘场景的流水线推理方法和装置

    公开(公告)号:CN118520960A

    公开(公告)日:2024-08-20

    申请号:CN202410652486.0

    申请日:2024-05-24

    摘要: 本发明公开了一种基于异构边缘场景的流水线推理方法和装置。其中,该方法由主节点执行包括:根据给定任务和设备组的信息,通过任务‑设备协同分析器预测流水线的计算延迟和通信延迟,并将深度神经网络跨设备组的适应性抽象为无向连通图;基于无相连通图,通过多流水线并行规划器生成包含所有潜在最优单流水线方案的类型集,并利用遗传算法生成多流水线并行策略;根据多流水线并行策略将任务分配到不同流水线的设备中进行推理。通过引入任务‑设备协同分析器来精确估计流水线的运行时延迟,引入多流水线并行规划器来生成多流水并行策略,该方法能够支持提前进行高质量的离线并行规划,从而实现DNN任务流中的无缝任务切换和高效的流水线并行。

    面向异构计算集群的AI模型自动化移植方法和装置

    公开(公告)号:CN117391124A

    公开(公告)日:2024-01-12

    申请号:CN202311290347.X

    申请日:2023-10-08

    IPC分类号: G06N3/04 G06F18/241

    摘要: 本发明公开了一种面向异构计算集群的AI模型自动化移植方法和装置。其中,该方法包括:自动生成待移植模型的若干离线模型;通过预测各离线模型在目标硬件平台上的性能,筛选出离线模型的最佳执行参数;基于代码生成器和元编程技术自动生成代码,以得到所述目标离线模型部署在所述目标硬件平台上的可执行程序,实现目标离线模型在所述目标硬件平台上的自动化移植。本发明提供的技术方案,解决了异构计算集群中的不同计算平台间AI模型的自动化移植难题,典型的,该AI模型为智能信道传播模型,该方法可以降低模型移植的工作量,提升移植后的AI模型的推理效率,显著提升大规模AI模型计算的时效性。

    一种基于芯粒特性感知的硬件建模方法及装置

    公开(公告)号:CN118467313A

    公开(公告)日:2024-08-09

    申请号:CN202410605215.X

    申请日:2024-05-15

    摘要: 本发明公开了一种基于芯粒特性感知的硬件建模方法及装置,包括:获取每个芯粒的芯粒信息,对每个芯粒的芯粒信息执行预处理操作得到每个芯粒的芯粒特性信息;基于所有芯粒的芯粒特性信息,生成第一任务集合,并确定第一任务集合对应的第一任务集特征;基于所有芯粒的芯粒特性信息,生成第二任务集合,并确定第二任务集合对应的第二任务集特征;对第一任务集特征以及第二任务集特征执行特征融合操作,得到目标特征向量,基于目标特征向量执行硬件建模操作得到目标模型。可见,实施本发明能够基于芯粒特性感知智能化进行硬件建模,能够对多芯片的性能进行建模和分析,有利于提高硬件建模的准确性和可靠性以及有利于提高硬件建模的智能性和效率。

    性能预测模型的训练方法及装置、性能预测方法及装置

    公开(公告)号:CN118690824A

    公开(公告)日:2024-09-24

    申请号:CN202411186366.2

    申请日:2024-08-28

    IPC分类号: G06N3/0895 G06N3/0455

    摘要: 本发明提供了一种性能预测模型的训练方法及装置、性能预测方法及装置,应用于数据处理技术领域。性能预测模型的训练方法包括:利用目标计算单元对无标签神经网络结构数据执行掩码处理任务,得到可见节点特征矩阵、掩码节点特征矩阵和掩码标识矩阵;利用目标计算单元对掩码标识矩阵执行预测任务,得到述掩码标识矩阵的预测隐空间特征;利用目标计算单元对掩码节点特征矩阵执行编码任务,得到掩码节点特征矩阵的隐空间特征;利用目标计算单元对掩码标识矩阵的预测隐空间特征和掩码节点特征矩阵的隐空间特征执行损失计算任务,得到第一目标损失值;基于第一目标损失值,利用目标计算单元对性能预测模型执行训练任务,得到训练后的性能预测模型。

    图数据处理方法及装置
    5.
    发明公开

    公开(公告)号:CN118736368A

    公开(公告)日:2024-10-01

    申请号:CN202411215740.7

    申请日:2024-09-02

    摘要: 本发明提供了一种图数据处理方法及装置,可以应用于数据处理技术领域。该图数据处理方法包括:获取表征图数据的稀疏矩阵,稀疏矩阵包括多个行向量和多个列向量,行向量和列向量均表征图数据的顶点;对稀疏矩阵的行向量进行等值划分,得到多个稀疏分片,每个稀疏分片包括相同数量的非零元素,稀疏矩阵包括非零元素,非零元素表征图数据的不同的顶点之间的边关系;基于矩阵乘法算法将每个稀疏分片中的每个非零元素分别与预设密集矩阵进行数据融合,得到与图数据对应的结构特征,其中,多个非零元素并行与预设密集矩阵进行数据融合。

    一种自动梯度量化的联邦学习装置和方法

    公开(公告)号:CN113537511B

    公开(公告)日:2023-06-20

    申请号:CN202110793456.8

    申请日:2021-07-14

    IPC分类号: G06N20/00

    摘要: 本发明公开了一种自动梯度量化的联邦学习框架和方法。其中,所述框架包括:量化指示器模块、量化策略模块以及量化优化器模块;量化指示器模块用于确定历史模型量化指标和当前模型量化指标的量化指标差值;量化策略模块用于根据量化指标差值和当前模型量化指标来进行量化精度调整;量化优化器模块用于根据结合调整因子的梯度下降算法对模型进行训练,以得到更新后的模型。本实施例的技术方案,通过量化指示器模块、量化策略模块以及量化优化器模块的紧密协作来平衡各个节点每一轮迭代的通信时间,在异构边缘人工智能系统上实现了通信加速并保持模型训练的准确性。

    基于Entity Embedding和TCN模型的移动应用使用行为预测方法

    公开(公告)号:CN113762418B

    公开(公告)日:2023-06-06

    申请号:CN202111207574.2

    申请日:2021-10-18

    摘要: 本发明公开了基于Entity Embedding和TCN模型的移动应用使用行为预测方法,包括:获取用户的移动应用使用信息原始数据集;对移动应用使用信息原始数据集进行预处理;基于神经网络的Embedding层对分类型数据进行Entity Embedding,构建特征数据;以特征数据作为输入,构建TCN网络预测模型;通过训练和验证得到最佳TCN网络预测模型,对即将使用的移动应用进行预测。本发明综合考虑了App使用序列和上下文环境对App使用的影响,将Entity Embedding特征提取方法和TCN神经网络应用于移动应用使用行为预测,避免了传统机器学习模型繁琐的特征处理过程,而且使用Entity Embedding的方法提取特征数据,能够通过自定义输入到TCN模型的特征数据维度来提高TCN模型的预测能力。

    异构多核可重构计算平台上任务调度的方法和装置

    公开(公告)号:CN109144688B

    公开(公告)日:2022-09-23

    申请号:CN201810617444.8

    申请日:2015-03-27

    IPC分类号: G06F9/48 G06F9/50

    摘要: 本发明实施例提供一种异构多核可重构计算平台上任务调度的方法和装置,该方法包括:根据待执行的目标任务的热度和该异构多核可重构计算平台的可重构资源的使用率,确定该目标任务的执行方式,该执行方式包括硬件方式或软件方式,该目标任务在该异构多核可重构计算平台没有对应的用于执行该目标任务的目标知识产权IP核,该目标任务的热度用于指示该目标任务对中央处理器CPU的占用率,该可重构资源的使用率用于指示该可重构资源的使用情况;根据确定的执行方式,执行该目标任务。在本发明实施例中,根据任务的执行情况和可重构资源的使用情况动态确定任务的执行方式,能够有效提高计算平台的可重构资源的利用率,从而能够提高计算平台的整体性能。