任务处理方法和装置
    1.
    发明公开

    公开(公告)号:CN117850987A

    公开(公告)日:2024-04-09

    申请号:CN202211213164.3

    申请日:2022-09-30

    Abstract: 本申请实施例提供了一种任务处理方法和装置,能够解决任务处理的过程中端到端时延不确定的问题,能够适用于对端到端时延有确定性需求的场景,更符合工控、车、第五代通信技术与产业互联网等业务领域的要求,从而提高用户体验。上述方法包括:获取目标任务的有向无环图DAG、目标任务的端到端时延需求和至少一个处理器核心的标识,目标任务包括多个子任;将DAG、端到端时延需求和至少一个处理器核心的标识输入至任务模型,得到多个子任务更新后的时间信息和多个子任务中每个子任务对应的处理器核心,时间信息包括启动时间和处理时间,任务模型中包括预先设置的算法;按照更新后的时间信息在对应的处理器核心上处理多个子任务。

    一种AI智能模组的可靠性设计方法

    公开(公告)号:CN114897150B

    公开(公告)日:2023-04-07

    申请号:CN202210347712.5

    申请日:2022-04-01

    Abstract: 本发明公开了一种AI智能模组的可靠性设计方法,所述AI智能模组包括智能处理单元及其连接的内存单元、电源单元、以太网接口单元、PCIE接口单元、温度监测单元以及电流监测单元。此AI智能模组可以通过千兆网接口和PCIE高速接口,传输图像、视频等其他数据进行相关AI算法的加速处理,如图像增强、图像分类、目标检测、目标识别、目标跟踪等。本发明的AI智能模组的可靠性设计方法主要包含三类,一类是基于硬件电路限流保护的方法,一类是基于软件程序上注更新的方法,还有一类是基于软看门狗、重启指令的方法。一般来说,为完成上述三类方法的技术实现,还需要配套的辅助控制底板,如FPGA、CPLD等来共同完成。

    一种AI智能模组的可靠性设计方法

    公开(公告)号:CN114897150A

    公开(公告)日:2022-08-12

    申请号:CN202210347712.5

    申请日:2022-04-01

    Abstract: 本发明公开了一种AI智能模组的可靠性设计方法,所述AI智能模组包括智能处理单元及其连接的内存单元、电源单元、以太网接口单元、PCIE接口单元、温度监测单元以及电流监测单元。此AI智能模组可以通过千兆网接口和PCIE高速接口,传输图像、视频等其他数据进行相关AI算法的加速处理,如图像增强、图像分类、目标检测、目标识别、目标跟踪等。本发明的AI智能模组的可靠性设计方法主要包含三类,一类是基于硬件电路限流保护的方法,一类是基于软件程序上注更新的方法,还有一类是基于软看门狗、重启指令的方法。一般来说,为完成上述三类方法的技术实现,还需要配套的辅助控制底板,如FPGA、CPLD等来共同完成。

    基于异构算力感知的去中心化联邦学习框架及建模方法

    公开(公告)号:CN113033082A

    公开(公告)日:2021-06-25

    申请号:CN202110258488.8

    申请日:2021-03-10

    Abstract: 本发明公开了一种基于异构算力感知的去中心化联邦学习框架,包括云端协调器和若干设备端;所述云端协调器用于运行时管理、训练和参数更新方案生成、定期模型备份;所述设备端用于向云端协调器传输设备信息,在本地运行模型,更新设备端参数;所述云端协调器获取设备端一次训练时间的最小公倍数为超周期,设备端在超周期内计算不同的步长,在超周期的整数倍时聚合模型。根据设备计算能力不同而运行不同的本地步骤,在模型聚合过程中,为了减少慢节点的负面影响;采用了分布式的点对点通信方式,可以在不增加整体通信量的情况下,消除在分布式训练过程中中央服务器的通信压力。

    图数据处理方法及装置
    5.
    发明授权

    公开(公告)号:CN118736368B

    公开(公告)日:2024-12-31

    申请号:CN202411215740.7

    申请日:2024-09-02

    Abstract: 本发明提供了一种图数据处理方法及装置,可以应用于数据处理技术领域。该图数据处理方法包括:获取表征图数据的稀疏矩阵,稀疏矩阵包括多个行向量和多个列向量,行向量和列向量均表征图数据的顶点;对稀疏矩阵的行向量进行等值划分,得到多个稀疏分片,每个稀疏分片包括相同数量的非零元素,稀疏矩阵包括非零元素,非零元素表征图数据的不同的顶点之间的边关系;基于矩阵乘法算法将每个稀疏分片中的每个非零元素分别与预设密集矩阵进行数据融合,得到与图数据对应的结构特征,其中,多个非零元素并行与预设密集矩阵进行数据融合。

    基于GAN反演的鲁棒自适应图像处理方法

    公开(公告)号:CN116912083A

    公开(公告)日:2023-10-20

    申请号:CN202310897139.X

    申请日:2023-07-20

    Abstract: 本申请公开了一种基于GAN反演的鲁棒自适应图像处理方法,包括:步骤S1:建立基本框架,基本框架作为文本驱动的图像操作,对给定的文本提示t应用相同的编辑操作;步骤S2:GAN反演包括依序进行的:基于元素的EV剪枝、EV微调、LC搜索;步骤S3:建立稳健目标,构建图像的空间结构实现图像合成和语义分割,将多分支生成器集成到框架中,以捕获图像处理的空间局部性;步骤S4:定义图像因编辑而改变的感兴趣区域r;步骤S5:提出CLIP感知损失,放大感兴趣区域的图文相似度,降低外围区域的图文相似度;步骤S6:采用启发式算法去除编辑矢量噪音,同时为当前图像处理找到有意义的编辑向量和有意义的层。该方法图像搜索后能获得更精准的图像到图像映射结果。

    一种复数域上的三维卷积神经网络加速器及方法

    公开(公告)号:CN116596034A

    公开(公告)日:2023-08-15

    申请号:CN202310440957.7

    申请日:2023-04-23

    Abstract: 本发明公开了一种复数域上的三维卷积神经网络加速器及方法,该加速器包括:缓存单元,所述缓存单元用于存储复数域内的输入特征、输出特征和权重数据;AXI DMA单元,所述AXI DMA单元用于该加速器与片外存储器进行数据传输;计算单元,所述计算单元用于对所述卷积层和全连接层的计算进行加速;后处理单元,所述后处理单元用于计算融合后的量化层、池化层、批归一化层和激活层;控制单元,所述控制单元用于控制和调度所述缓存单元、AXI DMA单元、计算单元和后处理单元的工作状态。其可以显著提升3D CNN部署时的性能和能效。

    基于神经网络相似度建模的实时DNN调度系统及方法

    公开(公告)号:CN113485801B

    公开(公告)日:2023-07-28

    申请号:CN202110708893.5

    申请日:2021-06-25

    Abstract: 本发明公开了基于神经网络相似度建模的实时DNN调度系统及方法,包括:DNN特征提取模块,对DNN网络结构进行提取分析和判断,将需要预测的网络结构特征发送到DNN性能表征模块;DNN性能表征模块,进行网络结构特征进行性能预测,预测其在每个设备上的运行时间,经过目标微调后,调度模块对每个任务已知的性能表征进行调度,以确保任务以最小的等待时间在最大截止时间之前完成。本发明首先对神经网络任务进行神经网络建模,提取关键特征。紧接着,通过性能表征网络对每个设备上的每个任务进行性能表征预测,得到性能表征矩阵;最后,以性能表征矩阵性能表征矩阵为调度矩阵,利用LLF算法求解最优调度策略,有效提高了性能和任务接受率。

    基于异构算力感知的去中心化联邦学习框架及建模方法

    公开(公告)号:CN113033082B

    公开(公告)日:2023-06-06

    申请号:CN202110258488.8

    申请日:2021-03-10

    Abstract: 本发明公开了一种基于异构算力感知的去中心化联邦学习框架,包括云端协调器和若干设备端;所述云端协调器用于运行时管理、训练和参数更新方案生成、定期模型备份;所述设备端用于向云端协调器传输设备信息,在本地运行模型,更新设备端参数;所述云端协调器获取设备端一次训练时间的最小公倍数为超周期,设备端在超周期内计算不同的步长,在超周期的整数倍时聚合模型。根据设备计算能力不同而运行不同的本地步骤,在模型聚合过程中,为了减少慢节点的负面影响;采用了分布式的点对点通信方式,可以在不增加整体通信量的情况下,消除在分布式训练过程中中央服务器的通信压力。

    一种估算动态重构硬件加速中的性能开销方法和装置

    公开(公告)号:CN113900986A

    公开(公告)日:2022-01-07

    申请号:CN202111213307.6

    申请日:2021-10-19

    Abstract: 本发明公开了一种估算动态重构硬件加速中的性能开销方法和装置。其中,该方法包括:通过调整FPGA的可重构区域生成对应的比特流文件;根据可重构区域包含的资源数估算所述可重构区域比特流文件的大小;根据所述可重构区域比特流文件的大小和FPGA内部配置访问端口速度,确定可重构区域的重构时间。本发明实施例提供的技术方案,通过对可重构区资源的统计分析,可以在不需要实际布局布线即可获得重构开销的估计值,能够在设计帮助设计者在设计初期有效评估可重构设计的合理性,缩短试验周期;通过对比特流文件的解析、比特流格式和配置每列资源帧组织的分析,提高了估算结果的准确性。

Patent Agency Ranking