-
公开(公告)号:CN118860672A
公开(公告)日:2024-10-29
申请号:CN202411345437.9
申请日:2024-09-26
摘要: 本发明涉及基于申威众核处理器的从核阵列自主抢占式负载均衡方法,属于电子信息的技术领域,包括:1)针对大规模任务,采用分治法进行分解;2)对于得到的小规模任务,进行动静态混合的任务划分;在静态任务区中,采用均匀分配方式,在动态任务区中,采用动态分配方式;3)将动态任务区的每个任务执行信息映射到一个标识缓冲区中;同时采用双缓冲的策略,通过配置两个标识缓冲区,实现在执行本轮任务的同时将下一轮使用的缓冲区重置;在从核成功获取到要执行的任务执行信息后,使用DMA的方式,将在动态任务区中读取到的任务在本从核的LDM私有空间中进行计算。本发明具有比较明显的加速效果。
-
公开(公告)号:CN118484555A
公开(公告)日:2024-08-13
申请号:CN202410651610.1
申请日:2024-05-24
IPC分类号: G06F16/58 , G06F16/538 , G06V10/44 , G06V10/80 , G06V10/82 , G16H70/60 , G16H30/00 , G06N3/08
摘要: 一种基于特征融合的医学图像检索方法,涉及图像检索技术领域,通过对数据集进行预处理,得到一个较好的数据集可以用于模型的训练,通过使用改进后的Fuzzy‑ASPP子模块对图像进行多尺度局部特征提取,使用GeM池化得到全局特征,最后使用加权特征融合的方式得到对图像正确的融合描述子。这样设计的多尺度融合特征提取网络提高了检索的准确度和效率。
-
公开(公告)号:CN118396969A
公开(公告)日:2024-07-26
申请号:CN202410597023.9
申请日:2024-05-14
IPC分类号: G06T7/00 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464
摘要: 本发明公开了一种基于3D卷积神经网络的肺部CT影像衰老评估方法及系统,方法包括:获取待检测的肺部影像数据并进行预处理;将预处理后的数据输入至训练好的3D卷积神经网络模型,得到肺部衰老评估结果;其中,所述3D卷积神经网络模型包括:依次设置的多个3D卷积和最大池化层、3D全局平均池化层、注意力机制模块、展平层和两个全连接层;所述注意力机制模块包括依次连接的四个卷积层。本发明在3D卷积神经网络模型中添加注意力机制,不仅能捕捉到全局和局部的空间特征,还能根据任务的需求动态地调整其对这些特征的关注程度。
-
公开(公告)号:CN117633232A
公开(公告)日:2024-03-01
申请号:CN202311661689.8
申请日:2023-12-06
IPC分类号: G06F16/35 , G06N3/0442
摘要: 本发明涉及一种基于热点预测的Hudi异步数据聚类的方法和系统;包括:SQL查询语句解析,包括收集SQL语句、分词处理、建立词汇表、建立嵌入层;基于获取并解析后的SQL语句,采用训练好的基于在线学习算法的LSTM模型预测查询热点字段和查询热点表;获取训练好的基于在线学习算法的LSTM模型预测的查询热点字段和查询热点表,多次自动化进行异步数据聚类分析。本发明可以一定程度地避免异步聚类时产生的数据不一致问题,使得分区中的数据文件有较高的新鲜度;另外,通过优化热点数据布局,大大提高了以Hudi作为Presto引擎数据源时的查询效率。
-
公开(公告)号:CN117557093A
公开(公告)日:2024-02-13
申请号:CN202311468817.7
申请日:2023-11-07
IPC分类号: G06Q10/0635 , G06Q10/04 , G06F16/906 , G06F16/9535 , G06F16/9537 , G06F18/213 , G06F18/2415 , G06N3/047 , G06N3/048 , G06N3/084 , G06Q50/20 , H04L67/02
摘要: 本发明涉及一种基于在线学习平台的早期学业风险预警方法及系统,是指:将在线学习平台产生的学生原始数据集依次经过数据处理、特征选择、学业风险预测、学业预警,与在线学习平台进行集成,对其中有学业风险的学生发送预警信息进行提醒;特征选择,包括:接收学生数据集,经过基于支持向量机的遗传算法处理后,输出最优子集学生数据集;学业风险预测,包括:接收最优子集学生数据集,传入混合神经网络模型即H2AL模型中进行训练,得到训练好的H2AL模型;本发明能够进行自动特征提取,更好地反映数据的内在结构,能够有效地处理大量特征,从中提取出最相关的信息,有助于减少模型对噪声和不必要特征的过度拟合,从而提高模型的泛化能力。
-
公开(公告)号:CN117033026A
公开(公告)日:2023-11-10
申请号:CN202311038791.2
申请日:2023-08-17
IPC分类号: G06F9/54
摘要: 本发明涉及一种基于新一代神威超级计算机硬件架构的多层次集合通信的优化方法,包括:根据应用程序所使用的进程数不同,确定应用程序属于哪一种情况;根据新一代神威超级计算机的硬件架构,对不同情况内的1对N型、N对1型、N对N型集合通信函数进行优化,包括:通过进程分组,在各组内进行集合通信,用下层架构中的通信来代替上层架构中的通信。本发明考虑到应用程序所需要的进程数存在多种情况以及实际可供使用的资源,在多种情况下进行了测试。本发明方法在实际使用时所受的进程资源的限制,提供了处理不同资源限制下的方法,减少了使用难度,提高了用户体验。经过本发明方法优化后的集合通信函数拥有明显的加速效果。
-
公开(公告)号:CN116069481A
公开(公告)日:2023-05-05
申请号:CN202310354096.0
申请日:2023-04-06
摘要: 本发明属于图形处理器资源调度领域,提供了一种共享GPU资源的容器调度系统及调度方法,针对GPU资源由系统外部在各应用平台进行复用,将导致服务器的反复初始化及迁移,造成人工损耗以及时间的浪费的问题,本发明考虑从计算任务移植方面进行GPU资源的共享,在GPU资源池上构建容器系统,通过将各个平台的任务容器化后调度到提供的资源池GPU节点上,实现异构平台间GPU资源共享,提高整体平台的GPU资源利用率可满足云计算、大数据、人工智能和高性能计算场景平台的快速灵活部署实施。
-
公开(公告)号:CN118656126A
公开(公告)日:2024-09-17
申请号:CN202410820407.2
申请日:2024-06-24
摘要: 本发明涉及电子信息技术领域,提供了一种基于神威超级计算机的AztecOO移植优化方法及系统。该方法包括,将Epetra和AztecOO移植到新一代神威超级计算机的主核上;基于移植后主程序的计算热点,采用手动插桩的方式,在主程序内部进行细粒度热点分析,找到计算密集函数,计算密集函数为CSR格式的稀疏矩阵向量乘的子程序;将所述子程序中假定大小数组格式改为固定内存分配方式,调整数组的具体大小;将所述稀疏矩阵中的数据按行等分,平均分配给所有从核,以使从核对分配的数据进行线程级并行计算,达到所述从核能同时完成数据计算的目的;从访存速度和访存带宽两方面进行了从核访存优化,提高了带宽利用率和访存效率,极大提升了程序计算性能。
-
公开(公告)号:CN118485262A
公开(公告)日:2024-08-13
申请号:CN202410666079.5
申请日:2024-05-28
IPC分类号: G06Q10/0631 , G06Q50/04 , G06N3/126
摘要: 一种基于神威架构求解作业车间调度问题的遗传算法的并行优化方法,涉及作业车间调度技术领域,包括了遗传算法求解作业车间调度问题的染色体编码方案、为避免产生局部最优解的种群进化方案、遗传算法的MPI并行方案和MPI通信优化、利用神威架构提供的三种通信方式(DMA、RMA和gld/gst指令)进行微架构调优,提供了一套高效可行的并行方案。
-
公开(公告)号:CN117744712A
公开(公告)日:2024-03-22
申请号:CN202410182580.4
申请日:2024-02-19
IPC分类号: G06N3/0455 , G06N3/0499 , G06Q30/018 , G06Q50/26 , G06F18/211
摘要: 本发明涉及大气环境技术领域,提供了一种基于多要素驱动的臭氧前体物溯源方法及系统。该方法包括,获取大气污染物、气象数据和源排放数据;基于大气污染物、气象数据和源排放数据,采用IEformer模型,在嵌入层将每个变量的整个时间序列独立嵌入一个第一时空张量;基于第一时空张量,在长方体注意力层进行分解,得到若干小长方体;在每个小长方体中并行应用长方体级自注意力后,将所有小长方体进行合并,得到第二时空张量;对第二时空张量进行处理,得到臭氧前体物溯源结果。
-
-
-
-
-
-
-
-
-