一种用于图计算的指令执行方法及装置

    公开(公告)号:CN115269016A

    公开(公告)日:2022-11-01

    申请号:CN202211177797.3

    申请日:2022-09-27

    Abstract: 本发明公开了一种用于图计算的指令执行方法及装置,包括以下步骤:步骤S1:将用于神经网络计算的计算图中每个节点的算子下发到算子解释器;步骤S2:算子解释器构建运行时的指令;步骤S3:定义指令依赖关系;步骤S4:构建指令依赖关系图;步骤S5:构建并行指令的拓扑顺序;步骤S6:将并行指令调度到硬件资源上;步骤S7:构建并行指令的最短调度:在硬件资源限制的条件下并行指令执行所需的最短时间;步骤S8:释放已经执行完的指令。本发明从全局角度分析计算图执行过程中节点所包含指令之间的依赖关系以及基于依赖关系推导全局计算图中可并行执行指令的拓扑顺序,提供了将并行指令最快地调度到硬件资源上的方法和装置,优化了计算图的编译效率。

    一种用于增强行人局部特征的联合建模方法和装置

    公开(公告)号:CN115240121A

    公开(公告)日:2022-10-25

    申请号:CN202211155651.9

    申请日:2022-09-22

    Inventor: 王宏升 陈光

    Abstract: 本发明公开了一种用于增强行人局部特征的联合建模方法和装置,包括以下步骤:S1:获取原始监控视频图像数据集,将原始监控视频图像数据集按比例划分训练集与测试集;S2:将监控视频图像训练集进行切割得到图像块向量序列;本发明采用多头注意力神经网络提取视频图像行人局部特征,使用通道卷积核学习图像通道权重参数,利用空间卷积在图像上扫描空间特征,增强行人局部特征提高行人识别率,采用前馈神经网络与激活函数,输入前馈神经网络经过线性层变换,并采用激活函数将行人概率分布映射成分类,识别出行人,输出行人在图像中位置坐标并框选出行人,实现行人重识别,使得能够获取可用的人脸图像。

    一种针对未配对数据集的图像生成方法及装置

    公开(公告)号:CN114758035B

    公开(公告)日:2022-09-27

    申请号:CN202210661703.3

    申请日:2022-06-13

    Abstract: 本发明公开了一种针对未配对数据集的图像生成方法及装置,该方法包括:对第一模型和第二模型进行改进,其中所述第二模型包括第一子模型和第二子模型;将两组内部具有相同数据分布的未配对数据集作为改进后的第一模型的输入,训练改进后的第一模型,并通过改进后的第一模型训练完成后输出的两组配对数据集分别训练改进后的第一子模型和第二子模型;获取未配对数据集;将所述未配对数据集输入训练后的第一模型后,得到所述第一模型生成的第一生成数据集和第二生成数据集;将所述第一生成数据集和第二生成数据集分别输入训练后的第一子模型和第二子模型,并将所述第一子模型和第二子模型生成的第三生成数据集和第四生成数据集作为最终生成结果。

    一种基于局部特征注意力的行人重识别方法和装置

    公开(公告)号:CN114783003B

    公开(公告)日:2022-09-20

    申请号:CN202210714468.1

    申请日:2022-06-23

    Inventor: 王宏升 陈光

    Abstract: 本发明公开了一种基于局部特征注意力的行人重识别方法和装置,包括如下步骤:S1:获取原始监控视频图像数据集,并将原始监控视频图像数据集按比例划分训练集与测试集;S2:将原始监控视频图像训练集进行图像增强,得到增强图像,并将所述增强图像转化成序列数据;基于局部特征注意力的行人重识别技术,采用多头注意力机制神经网络对捕捉提取视频图像特征序列,使用多头注意力机制代替卷积神经网络中的卷积核,采用全连接层与激活函数,针对行人局部特征序列通过权值矩阵组合成完整行人特征序列,将已得到行人特征序列进行预测,输出行人在图像中位置坐标并框选出行人,实现行人重识别。

    一种用于神经网络计算的图优化方法和装置

    公开(公告)号:CN114936099A

    公开(公告)日:2022-08-23

    申请号:CN202210874564.2

    申请日:2022-07-25

    Inventor: 王宏升 陈光

    Abstract: 本发明公开了一种用于神经网络计算的图优化方法和装置,包括以下步骤:步骤S1:转换计算图;步骤S2:分配寄存器;步骤S3:定义关于重定义变量的路由选择器;步骤S4:求解关于重定义变量的路由选择器;步骤S5:定义关于重定义变量的路由选择器插入节点的准则;步骤S6:分析关于重定义变量节点的支配边集合;步骤S7:插入关于重定义变量的路由选择器;步骤S8:重命名关于重定义变量。本发明解决了编译期计算图中包含重定义变量的节点流经多路计算流时所对应的关于重定义变量的正确定义的路由选择问题,减少数据流中张量变量所需的内存开销,降低了大模型对于硬件内存资源的要求,推动了深度神经网络模型落地应用的发展。

    一种基于中心相似度学习的哈希码生成方法及装置

    公开(公告)号:CN114896434A

    公开(公告)日:2022-08-12

    申请号:CN202210821230.9

    申请日:2022-07-13

    Abstract: 本发明公开了一种基于中心相似度学习的哈希码生成方法及装置,该方法包括:获取带有标签的训练数据集;利用哈达玛矩阵,为所述训练数据集中相同标签的数据构造一个共享的哈希中心,从而得到若干哈希中心;根据所述训练数据集中的样本经过多模态神经网络生成的哈希码与该数据对应的哈希中心之间的距离,计算得到中心相似性学习的目标损失函数;根据所述中心相似性学习的目标损失函数,训练多模态神经网络;获取多模态数据并对所述多模态数据进行预处理;将预处理后的多模态数据输入训练后的多模态神经网络中,生成多模态哈希码。

    面向神经网络计算的分布式数据路由的建模方法和装置

    公开(公告)号:CN114598631A

    公开(公告)日:2022-06-07

    申请号:CN202210455426.0

    申请日:2022-04-28

    Abstract: 本发明提供了一种面向神经网络计算的分布式数据路由的建模方法和装置,包括如下步骤:S1:设计物理张量的分布式属性:将逻辑张量与物理张量的映射关系抽象为广播属性、散播属性和局部规约属性三种分布式属性;S2:推演输出张量的分布式属性:指定输入张量的分布式属性,然后根据已知的输入张量的分布式属性推演输出张量的合法分布式属性;S3:根据分布式属性情形判断是否需要插入中间通信原语得到局部物理张量的分布式属性;利用所述的面向神经网络计算的分布式数据路由的建模方法和装置搭建模型,分布式设计和开发的难度低,推动了深度神经网络大模型落地应用的发展。

    一种面向神经网络模型计算的图执行方法和装置

    公开(公告)号:CN114237918B

    公开(公告)日:2022-05-27

    申请号:CN202210183223.0

    申请日:2022-02-28

    Abstract: 本发明公开了一种面向神经网络模型计算的图执行方法和装置,包括根据深度学习框架编译生成的物理计算图,创建本机上的任务执行体,通过设计为每个任务执行体分配多个空闲内存块的方案,实现整张计算图以流水并行的方式同时参与到不同批次数据的深度学习训练任务中,本发明公开的面向神经网络模型计算的图执行方法和装置,以算子核函数的执行体为基本单元,以生产和消费的张量作为整个计算图中流动的数据,执行体以流水并行的方式实现模型的训练过程。在大规模深度神经网络的分布式应用场景下,本发明对用户的使用门槛较低,并且能够使模型学习到大量分批次流入神经网络的数据的内在关联,从而获得对应场景中的“智能”感知与判断能力。

    一种边缘计算服务漫游的方法及装置

    公开(公告)号:CN114449486A

    公开(公告)日:2022-05-06

    申请号:CN202111586298.5

    申请日:2021-12-23

    Inventor: 程宏才 陈光

    Abstract: 本发明公开了一种边缘计算服务漫游的方法及装置,使移动终端设备在移动过程中保持边缘端计算服务的连续性和稳定性。当终端设备需要在不同接入站点间切换时,在接入控制站点的帮助下,终端设备选择无线网络的接入站点,完成服务从原服务站点向新服务站点的迁移,并通过新服务站点与原服务站点的服务状态和结果的提前同步,保障服务迁移的时延性能。通过网络接入控制站点在处理决策网络漫游请求时,同步进行计算服务漫游决策,并同步进行网络的漫游交互和计算服务的漫游迁移工作,降低整体迁移时间,保障迁移后的服务性能。

    一种加密图的邻居节点查询方法及装置、电子设备

    公开(公告)号:CN114417073A

    公开(公告)日:2022-04-29

    申请号:CN202210309856.1

    申请日:2022-03-28

    Abstract: 本发明公开了一种加密图的邻居节点查询方法及装置、电子设备,该方法包括:提取每个节点的邻居节点,生成邻居节点表;根据邻居节点表和生成的密钥组,生成加密索引字典;对加密索引字典进行扩充,将扩充索引字典发送至云服务器以使得云服务器对扩充索引字典进行存储;接收用户端的关于目标节点的查询请求;根据查询请求和密钥组,生成目标节点的查询令牌;向用户端发送查询令牌和密钥组,以使得用户端向云服务器发送查询令牌,云服务器根据查询令牌和扩充索引字典,对目标节点的邻居节点进行查询,将查询结果发送至用户端,用户端根据密钥组对查询结果进行解密,从而得到目标节点的明文查询结果。该方法可实现top‑H跳邻居节点和top‑k邻居节点的查询。

Patent Agency Ranking