-
公开(公告)号:CN114221861A
公开(公告)日:2022-03-22
申请号:CN202110324736.4
申请日:2021-03-26
申请人: 无锡江南计算技术研究所
IPC分类号: H04L41/0803 , H04L41/06 , H04L47/10
摘要: 本发明公开一种大规模互连网络的管理包收发方法,包括以下步骤:S1、初始设置;S2、自动控制,具体如下:S21、命令发送线程在发送时,判断curr_send_package是否小于max_send_package,若小于,则启动一个定时器,发送命令,加线程锁,curr_send_package+1,解除线程锁;否则,阻塞该线程,等待该线程被唤醒;S22、命令接收线程,接收到管理包,加线程锁,curr_send_package‑1,解除线程锁,发送唤醒线程信号;S3、自动处理。本发明解决了大规模互连网络中网络管理包收发堵塞和网络管理包收发效率低的问题。
-
公开(公告)号:CN114218021A
公开(公告)日:2022-03-22
申请号:CN202110347331.2
申请日:2021-03-31
申请人: 无锡江南计算技术研究所
IPC分类号: G06F11/22
摘要: 本发明公开一种基于RNIC的多核处理器上消息性能故障定位方法,包括以下步骤:S1:在存控K上申请两片内存空间;S2:按K递增的顺序,通过RNIC串行将存控K中的发送数据发送到存控K中的接收数据中,进行第K+1轮测试;S3:得到测试性能数据bwK;S5:在存控K上申请两片内存空间;S6:通过RNIC并行将存控K中的发送数据发送到存控K+S中的接收数据中,进行第step=S+1轮测试;S7:计算消息性能bwS_K;S8:通过判断bwS_K是否低于最低带宽阈值bw_threshold来判断故障原因。本发明解决了基于RNIC的多核处理器上消息性能故障定位难的问题。
-
公开(公告)号:CN109088765B
公开(公告)日:2021-10-29
申请号:CN201810929702.6
申请日:2018-08-15
申请人: 无锡江南计算技术研究所
IPC分类号: H04L12/24 , H04L12/721
摘要: 本发明公开一种互连网络路由故障诊断方法及装置,该方法根据起始节点端口的路由表信息和网络固定路由规则,自动计算出下一步路由信息,查询下一步路由的节点信息和节点端口路由表信息;重复上述过程,直到查询到最终节点信息。本发明能及时、快速、直观明了的诊断大规模网络路由故障,极大地提高了大规模网络路由故障的诊断效率,减少系统工作人员繁琐的工作量,大幅地提高了系统维护人员的工作效率。本发明为系统维护人员提供在网络系统故障的情况下帮助用户课题分析网络可能存在问题的非常有效的辅助工具。
-
公开(公告)号:CN109067752A
公开(公告)日:2018-12-21
申请号:CN201810928706.2
申请日:2018-08-15
申请人: 无锡江南计算技术研究所
摘要: 本发明公开一种利用RDMA消息实现兼容TCP/IP协议的方法,该方法利用RDMA消息传输IP数据报文,实现对TCP/IP协议的兼容,可以获得比传统的利用Send/Recv传输IP报文更高的消息性能。本发明通过rdmabuf通告及补充机制,预先分配rdmabuf,以降低消息延迟;通过rdmabuf失效方法,在发送端可以避免使用无效的rdmabuf,在接收端可以节省内存消耗;采用rdmabuf池机制,预先分配rdmabuf,提高rdmabuf的使用效率。
-
公开(公告)号:CN114244692B
公开(公告)日:2024-02-02
申请号:CN202110480187.X
申请日:2021-04-30
申请人: 无锡江南计算技术研究所
IPC分类号: H04L41/0677 , H04L43/0894
摘要: 本发明公开一种适用于超大规模互连网络的故障快速定位方法,包括以下步骤:S1、以CPU为单位,每个CPU起2个进程,每个进程占用一个引擎,2个进程进行对发带宽测试,检查带宽是否正常,筛选出PCIE链路及存控有问题的点;S2、以中板为单位,每个CPU上选2个进程,每个进程使用1个引擎,进程以异或算法进行A2A测试,检查每轮通信带宽是否低于阈值,筛选出有问题的计算网交换机;S3、以整个队列为单位,从每个中板中选出指定进程,所有中板一起进行A2A测试,筛选出有问题的顶层网交换机。本发明解决网络故障定位效率低和循环连续检查每个节点造成收发堵塞问题,极大提高网络故障的诊断效率。
-
公开(公告)号:CN112532410B
公开(公告)日:2023-10-31
申请号:CN201910879822.4
申请日:2019-09-18
申请人: 无锡江南计算技术研究所
IPC分类号: H04L41/12 , H04L41/0813 , H04L49/111
摘要: 本发明公开了一种大规模互连网络Trap快速响应方法,包括以下步骤:网络管理接收Trap消息,判断状态改变的端口所连接的节点类型是否为网卡,如果是,执行下一步,否则重新探查网络;判断端口变化情况,如果端口由可用变为不可用,不需要响应该Trap消息,维持当前状态不变,如果端口由不可用变为可用,继续执行下一步;判断端口软件可用位是否为可用,如果是,激活该网卡,使其变为可用,否则重新探查网络。本发明优化了网卡端口状态发生改变的处理过程,只有当网卡端口由不可用变为可用,且与其相连的交换机端口的软件可用位也不可用时,才启动探查网络,节省了不必要的网络探查时间,大大提高了网络管理的响应速度。
-
公开(公告)号:CN112422244B
公开(公告)日:2022-11-25
申请号:CN201910771718.3
申请日:2019-08-21
申请人: 无锡江南计算技术研究所
IPC分类号: H04L5/00 , H04L47/722 , H04L47/83
摘要: 本发明公开一种基于流量负载预测的RDMA缓冲区动态分配方法,包括以下步骤:S1、检查RDMA被动方是否有可用的RDMA缓冲区;S2、检查未使用的RDMA缓冲区的个数及armed是否为0;S3、RDMA被动方若在规定时间内没有分配任何RDMA缓冲区,则发送一条控制消息将TSER告知RDMA发起方;S4、RDMA发起方不断测量RDMA请求时间间隔、分配RDMA缓冲区的请求/应答时间;S5、根据获得的at和rtt,计算获得加权平均RDMA请求时间间隔avg_at和分配RDMA缓冲区的请求/应答时间间隔avg_rtt;S6、根据avg_at和avg_rtt计算并更新rbuf_thresh的大小。本发明实现对RDMA缓冲区的动态分配,在保证网络高带宽的同时,可以显著降低预先分配的RDMA缓冲区数量,降低内存消耗量。
-
公开(公告)号:CN108880914B
公开(公告)日:2021-08-10
申请号:CN201810930202.4
申请日:2018-08-15
申请人: 无锡江南计算技术研究所
摘要: 本发明公开一种基于网络带宽测试的互连网络故障检测与定位方法,该方法包括:S101、生成配对子集:选出最小、CPU出现次数最均衡的配对子集;S102、运行带宽测试进行故障检测与定位:运行并行测试程序,根据配对表测试每对CPU对间的带宽。本发明能够快速定位大规模互连网络中的故障,缩短排查故障的时间,提升了大规模网络的可用性、易用性、可维护性。
-
公开(公告)号:CN108880914A
公开(公告)日:2018-11-23
申请号:CN201810930202.4
申请日:2018-08-15
申请人: 无锡江南计算技术研究所
摘要: 本发明公开一种基于网络带宽测试的互连网络故障检测与定位方法,该方法包括:S101、生成配对子集:选出最小、CPU出现次数最均衡的配对子集;S102、运行带宽测试进行故障检测与定位:运行并行测试程序,根据配对表测试每对CPU对间的带宽。本发明能够快速定位大规模互连网络中的故障,缩短排查故障的时间,提升了大规模网络的可用性、易用性、可维护性。
-
公开(公告)号:CN114221861B
公开(公告)日:2023-07-07
申请号:CN202110324736.4
申请日:2021-03-26
申请人: 无锡江南计算技术研究所
IPC分类号: H04L41/0803 , H04L41/06 , H04L47/10
摘要: 本发明公开一种大规模互连网络的管理包收发方法,包括以下步骤:S1、初始设置;S2、自动控制,具体如下:S21、命令发送线程在发送时,判断curr_send_package是否小于max_send_package,若小于,则启动一个定时器,发送命令,加线程锁,curr_send_package+1,解除线程锁;否则,阻塞该线程,等待该线程被唤醒;S22、命令接收线程,接收到管理包,加线程锁,curr_send_package‑1,解除线程锁,发送唤醒线程信号;S3、自动处理。本发明解决了大规模互连网络中网络管理包收发堵塞和网络管理包收发效率低的问题。
-
-
-
-
-
-
-
-
-