-
公开(公告)号:CN118917993A
公开(公告)日:2024-11-08
申请号:CN202411186985.1
申请日:2024-08-27
申请人: 联想(北京)有限公司
IPC分类号: G06T1/20
摘要: 本申请公开了一种图形处理器运行控制方法及控制装置,该方法包括:根据图形处理器的当前运行数据,控制图形处理器处于第一运行状态;控制图形处理器的显存进入目标数据的读取模式;响应于接收到与目标数据对应的数据推理任务,控制图形处理器进入执行数据推理任务的第二运行状态;其中,图形处理器处于第一运行状态的功耗小于图形处理器处于第二运行状态的功耗。
-
-
-
-
-
公开(公告)号:CN118885711A
公开(公告)日:2024-11-01
申请号:CN202411073503.1
申请日:2024-08-06
申请人: 北京大学 , 北京大学长沙计算与数字经济研究院
摘要: 本申请公开了一种一维快速傅里叶变换数据处理方法、装置及电子设备。其中,该方法包括:对待处理序列进行分解,得到多个子序列,多个子序列的子序列数量和子序列的子序列维度为待处理序列的分解因子;依据待处理序列的序列长度和分解因子确定与待处理序列对应的计算图;依据计算图,多个子序列和图形处理器平台的硬件参数在图形处理器平台中确定目标内核的配置信息;依据配置信息在图形处理器平台中生成与目标内核对应的目标内核函数,并执行目标内核函数来对多个子序列进行求解。本申请解决了相关技术中的一维快速傅里叶变换计算方法均对图形处理器的结构有要求导致的泛用性较低的技术问题。
-
公开(公告)号:CN118871925A
公开(公告)日:2024-10-29
申请号:CN202380026060.8
申请日:2023-02-13
申请人: 西门子股份公司
IPC分类号: G06N3/0464 , G06N3/063 , G06T1/20 , G01N21/88 , G06N3/082
摘要: 本发明公开了一种用于加速具有层的神经网络的深度学习推理的计算机实现的方法,其中由像素组成的逐行图像是通过线相机(1)扫描物体(3)而被生成的,其中:对于添加到图像的每个新像素行,使用先前对当前层的像素的计算的结果,而不是重复计算,以计算下一层中像素的值。也公开了一种包括神经网络的对应布置。
-
公开(公告)号:CN118870430A
公开(公告)日:2024-10-29
申请号:CN202410885624.X
申请日:2024-07-03
申请人: 沈阳航空航天大学
摘要: 本发明提供一种面向图像处理的无人机辅助计算卸载方法,涉及无人机边缘计算技术领域。该方法首先通过地面网络和移动设备信息以及无人机状态信息建立面向图像处理的MEC系统的通信和计算模型;再通过MEC系统的计算和通信模型建立无人机辅助计算卸载优化模型;然后将无人机辅助计算卸载优化模型表示为马尔可夫模型,并且通过DDPG算法求解马尔可夫模型得到无人机辅助计算卸载策略。该方法提供了一种在新一代物联网网络环境下的,面向图像处理的无人机辅助计算卸载框架,基于DDPG的算法提供无人机卸载策略以最小化总处理延迟。
-
公开(公告)号:CN118864643A
公开(公告)日:2024-10-29
申请号:CN202310475323.5
申请日:2023-04-28
申请人: 珠海一微半导体股份有限公司
摘要: 本申请公开逐层遍历栅格地图的激光点筛选系统,激光点筛选系统包括状态机控制模块、激光点处理模块和DDR存储器;激光点处理模块被划分为多条数据通道以及累加器;激光点处理模块,用于从DDR存储器获取多分辨率栅格地图并逐层遍历栅格地图;还从DDR存储器依次读取当前激光点;当前激光点在每条数据通道内都配置为并行执行当前层栅格地图中的各轮位置变换操作,并行获得目标点及其对应的占据概率值;对于同一个激光点,通过各轮位置变换操作在当前层栅格地图中得到的目标点所对应的占据概率值通过累加器依次相加,计算出动态概率和值;激光点处理模块用于基于当前激光点对应的动态概率和值判断到当前激光点是不可行解时,累加器停止相加。
-
公开(公告)号:CN118860913A
公开(公告)日:2024-10-29
申请号:CN202410931567.4
申请日:2024-07-11
申请人: 北京焱融科技有限公司
发明人: 李勇
IPC分类号: G06F12/0882 , G06F12/0831 , G06T1/60 , G06T1/20
摘要: 本申请公开了一种GPU访问分布式存储的方法、装置及计算机设备,将用户提交的GPU内存IO请求传输至虚拟文件系统vfs层,通过vfs层查找GPU内存IO请求所对应的物理地址,并将页面锁定在物理内存中;将物理地址进行合并处理,得到一个分散‑聚集列表sg list,将sg list中的物理内存区域映射为DMA所需的物理地址范围,并RDMA到远端的存储节点;存储节点接收到物理地址后进行整合,并在磁盘上进行DIO读写,得到读写完的数据,然后通过DMA发送到计算节点;计算节点接收到数据后将分散‑聚集列表中描述的多个的物理内存区域解除映射,能够减少RDMA交互次数,在提升性能的同时,也降低了系统负载。
-
-
-
-
-
-
-
-
-