-
公开(公告)号:CN117527651A
公开(公告)日:2024-02-06
申请号:CN202311662109.7
申请日:2023-12-06
申请人: 浪潮云信息技术股份公司
IPC分类号: H04L43/0894 , H04L43/50
摘要: 本发明提出了一种测试物理服务器网络带宽的方法,属于计算机网络领域。在测试物理服务器网络带宽的时候,使用单进程iperf3测试的数据往往收到cpu的限制,没有办法打满整个带宽。使用多进程iperf3得时候,也往往会因为各种原因导致测试的带宽低下,udp大量丢包。本方法介绍了一种使用iperf3测试带宽的方法,通过网卡的RSS和Flow Director,将包转到numa所在的cpu上,同时避免了处理包/iperf3是被一个cpu超线程出来的cpu处理,有效的降低丢包率,提升iperf3处理能力,得到比较准确的TCP带宽和UDP带宽,反应更真实的网络性能。
-
公开(公告)号:CN118520869A
公开(公告)日:2024-08-20
申请号:CN202410920292.4
申请日:2024-07-10
申请人: 浪潮云信息技术股份公司
IPC分类号: G06F40/232 , G06F40/253 , G06F18/214 , G06N3/08
摘要: 本申请公开了一种基于大模型的文本纠错方法、装置、设备及存储介质,涉及人工智能技术领域,包括:基于大语言模型根据第一预设指令生成第一训练数据,并对预设数据进行人工标注生成第二训练数据,以构建训练数据集;通过预设文本纠错任务对应的第二预设指令和训练数据集构建相应的目标数据集,以利用目标数据集对大语言模型进行微调得到目标大语言模型;获取待纠错文本,并确定待纠错文本对应的纠错指令,以将待纠错文本和纠错指令进行拼接后输入目标大语言模型,得到纠错后的目标文本。基于大语言模型生成数据混合人工标注数据,并针对不同任务构造不同指令微调大模型,从而将拼写纠错和语法纠错串联起来,可以有效提升文本纠错准确率。
-
公开(公告)号:CN118301130A
公开(公告)日:2024-07-05
申请号:CN202410565705.1
申请日:2024-05-09
申请人: 浪潮云信息技术股份公司
IPC分类号: H04L61/5014 , H04L61/4511 , H04L9/06 , H04L45/00 , H04L45/748 , H04L47/12 , H04L49/9015
摘要: 本发明涉及云计算和计算机网络领域,具体提供了一种安全的远程连接动态IP方法及装置,当设备的动态IP租期结束的一定时间内,设备会向固定域名的服务器发送一份当前设备的IP与登入密钥,存储到远端新建的地址服务器中,在远端服务器中构建一个链表索引,根据设备第一次获取到的IP作为链表头,每当设备获取新的IP时,会根据IP重新在第一台服务器的IP的基础上链式记录下去。与现有技术相比,本发明能够通过本文的方式进行IP传递,建立更加安全的IP保护机制,使得动态IP能够更好的保持隐秘性和安全性。
-
公开(公告)号:CN118445397A
公开(公告)日:2024-08-06
申请号:CN202410652558.1
申请日:2024-05-24
申请人: 浪潮云信息技术股份公司
IPC分类号: G06F16/332 , G06F16/33 , G06N3/0475 , G06N3/094
摘要: 本申请公开了一种基于监督微调的大模型微调方法、装置、设备及介质,应用于大语言模型,涉及大模型领域,包括:基于所述大语言模型生成相应的合成数据,并根据所述合成数据构建所述大语言模型的训练数据集;根据预设数据清洗规则对所述训练数据集进行清洗,并根据预设数据检验规则对得到的清洗后数据集进行数据标注以及数据检验得到目标数据集;根据所述目标数据集利用预设模型微调工具对所述大语言模型进行微调训练,直至得到满足预设训练要求的目标大语言模型。通过引入合成数据,在真实数据很少的场景,可以短时间内生成大量数据,有效减少采集真实数据的时间,提高模型微调工作效率。
-
公开(公告)号:CN117527802A
公开(公告)日:2024-02-06
申请号:CN202311386876.X
申请日:2023-10-25
申请人: 浪潮云信息技术股份公司
IPC分类号: H04L67/1001 , H04L67/1034 , H04L41/0663
摘要: 本发明特别涉及一种提高负载均衡转发效率的实现方法。该提高负载均衡转发效率的实现方法,将负载均衡节点和后端上游服务器节点均匀分布于物理机上,并将负载均衡节点和后端上游服务器节点按照亲和关系分组,不同宿主机的后端上游服务器互为备份服务器;通过多级负载的形式,访问请求首先均分到负载均衡节点上,然后每个负载均衡节点优先转发给同宿主机的后端上游服务器。该提高负载均衡转发效率的实现方法,既不影响高可用架构,又不影响故障切换,还能有效减少跨宿主机之前的虚机通信,降低了整个云计算系统的东西向流量,减轻了东西向物理链路的压力,从而提高了负载均衡转发效率。
-
公开(公告)号:CN116886698A
公开(公告)日:2023-10-13
申请号:CN202310921073.3
申请日:2023-07-26
申请人: 浪潮云信息技术股份公司
IPC分类号: H04L67/1001 , H04L43/08 , H04L43/065
摘要: 本发明涉及网络健康管理技术领域,具体为一种改进负载均衡后端健康检查消耗资源的优化方法,包括以下步骤:定期进行后端服务器的健康检查;合并同类型的健康检查;有请求到达时,负载均衡将流量转发给了对应的后端服务器,并添加时间,记录返回体和返回状态码;有益效果为:本发明提出的改进负载均衡后端健康检查消耗资源的优化方法,当在一定时间段有业务流量时,负载均衡的健康检查可直接查询获取后端服务器的健康状态,不需要重新访问后端获取状态;对相同后端服务器进行合并,使得该负载均衡不同监听端口下的相同后端服务器只需要检查一次。
-
公开(公告)号:CN118966186A
公开(公告)日:2024-11-15
申请号:CN202411156165.8
申请日:2024-08-22
申请人: 浪潮云信息技术股份公司
IPC分类号: G06F40/186 , G06N5/04
摘要: 本发明提供一种公文写作模型训练方法及装置、介质、设备。该方法包括:通过网络爬虫技术获取多种公文类型的公文数据;对所述公文数据进行清洗;基于清洗后的公文数据,构造训练集;其中,所述训练集中包括多条训练样本,每一条训练样本包括任务指令、用户输入信息和公文信息;根据所述训练集,进行模型训练,得到公文写作模型;其中,所述公文写作模型能够在应用场景中基于用户输入信息和任务指令,生成公文大纲,并对所述公文大纲进行内容填充,得到对应的公文信息。基于本发明实施例可以得到一种公文写作模型。
-
公开(公告)号:CN118820400A
公开(公告)日:2024-10-22
申请号:CN202410955855.3
申请日:2024-07-17
申请人: 浪潮云信息技术股份公司
IPC分类号: G06F16/33 , G06F16/332 , G06F16/951 , G06F16/9538 , G06F16/338 , G06F16/38
摘要: 本发明实施例的方案包括:响应于检索需求,设置至少一种数据抓取方式获取实时数据;基于所述实时数据构建索引数据库;基于所述索引数据库设置至少一种类型的检索方案,对通过所述检索方案得到的检索结果进行重新排序;基于所述检索结果生成上下文提示,通过大语言模型基于所述上下文提示生成检索文本。本发明实施例的方案通过实时数据索引和多路召回机制,实现了对信息的高效检索和利用,显著提升了大语言模型在特定领域和实时场景下的内容生成质量和相关性,从而提高生成式任务的准确性和可靠性。
-
公开(公告)号:CN118246540B
公开(公告)日:2024-08-13
申请号:CN202410675246.2
申请日:2024-05-29
申请人: 浪潮云信息技术股份公司
摘要: 本申请公开了一种交互方法、装置、设备及存储介质,涉及数据处理技术领域,包括:获取当前交互请求,并利用预设语言模型生成与所述当前交互请求对应的知识检索请求;从预设知识文档库中检索与所述知识检索请求相匹配的若干候选文档;基于交叉熵损失函数对所述若干候选文档与所述当前交互请求进行计算,以根据相应的计算结果对所述若干候选文档进行排序,得到排序后文档;利用所述预设语言模型对所述排序后文档进行处理,以输出与所述当前交互请求对应的应答信息。这样一来,本申请可以对检索得到的候选文档进行重新排序,可以提高最终输入语言模型的文档与用户的交互请求的相关性,可以提高最终生成的应答信息与交互请求之间的交互效果。
-
公开(公告)号:CN118246540A
公开(公告)日:2024-06-25
申请号:CN202410675246.2
申请日:2024-05-29
申请人: 浪潮云信息技术股份公司
摘要: 本申请公开了一种交互方法、装置、设备及存储介质,涉及数据处理技术领域,包括:获取当前交互请求,并利用预设语言模型生成与所述当前交互请求对应的知识检索请求;从预设知识文档库中检索与所述知识检索请求相匹配的若干候选文档;基于交叉熵损失函数对所述若干候选文档与所述当前交互请求进行计算,以根据相应的计算结果对所述若干候选文档进行排序,得到排序后文档;利用所述预设语言模型对所述排序后文档进行处理,以输出与所述当前交互请求对应的应答信息。这样一来,本申请可以对检索得到的候选文档进行重新排序,可以提高最终输入语言模型的文档与用户的交互请求的相关性,可以提高最终生成的应答信息与交互请求之间的交互效果。
-
-
-
-
-
-
-
-
-