-
公开(公告)号:CN116151194B
公开(公告)日:2023-07-07
申请号:CN202310348704.7
申请日:2023-04-04
申请人: 上海燧原科技有限公司
IPC分类号: G06F40/12 , G06N3/0475 , G06N3/047 , G06N3/088 , G06N5/04
摘要: 本发明涉及自然语言处理技术领域,公开了一种中文通用语言的生成方法、装置、设备及存储介质。该方法包括:获取用户输入的风格提示符、中文文本前缀和文本生成长度;将用户输入的风格提示符、中文文本前缀和文本生成长度输入至预训练的目标语言模型,获取目标语言模型输出的续写文本;其中,目标语言模型基于生成式预训练网络建立;对续写文本进行展示。本实施例的技术方案,通过基于生成式预训练网络建立可以生成中文通用语言的语言模型,可以基于单一语言模型实现对不同风格的中文语言的自动生成,可以提升中文语言生成的多样性和通用性。
-
公开(公告)号:CN116151194A
公开(公告)日:2023-05-23
申请号:CN202310348704.7
申请日:2023-04-04
申请人: 上海燧原科技有限公司
IPC分类号: G06F40/12 , G06N3/0475 , G06N3/047 , G06N3/088 , G06N5/04
摘要: 本发明涉及自然语言处理技术领域,公开了一种中文通用语言的生成方法、装置、设备及存储介质。该方法包括:获取用户输入的风格提示符、中文文本前缀和文本生成长度;将用户输入的风格提示符、中文文本前缀和文本生成长度输入至预训练的目标语言模型,获取目标语言模型输出的续写文本;其中,目标语言模型基于生成式预训练网络建立;对续写文本进行展示。本实施例的技术方案,通过基于生成式预训练网络建立可以生成中文通用语言的语言模型,可以基于单一语言模型实现对不同风格的中文语言的自动生成,可以提升中文语言生成的多样性和通用性。
-
公开(公告)号:CN115098357A
公开(公告)日:2022-09-23
申请号:CN202210555691.6
申请日:2022-05-20
申请人: 上海燧原科技有限公司
摘要: 本发明公开了异常算子的检测方法、装置、计算机设备及存储介质。该方法包括:获取目标学习模型,目标学习模型使用待测软件栈中多个目标算子构成;对目标学习模型进行多轮训练,并根据训练过程中各目标算子的算子描述参数,生成与各目标算子分别对应的算子统计特征集;根据各目标算子的算子统计特征集,将各目标算子聚类到网络簇集合的多个网络簇中;根据网络簇集合中各网络簇的簇中心点之间距离差异,在网络簇集合中识别异常网络簇,并将聚类到异常网络簇的目标算子识别为异常算子。通过本发明实施例的技术方案,能够降低异常算子的检测过程中对人工经验的依赖,提升软件栈中异常算子的检测效率及准确率。
-
公开(公告)号:CN115146119A
公开(公告)日:2022-10-04
申请号:CN202210871829.3
申请日:2022-07-22
申请人: 上海燧原科技有限公司
IPC分类号: G06F16/903 , G06F17/16 , G06K9/62 , G06N20/00
摘要: 本发明公开了一种分布式梯度的压缩训练方法、装置、设备及介质。该方法包括:在确定满足策略矩阵启动学习条件时,控制分布式集群中的各工作节点执行第一阶段梯度压缩训练;在第一阶段梯度压缩训练过程的每轮训练中,根据每个轮次与前序至少一个轮次相比的损失值和训练耗时差异,动态更新策略矩阵;在完成第一阶段梯度压缩训练时,控制分布式集群中的各工作节点执行第二阶段梯度压缩训练;在第二阶段梯度压缩训练过程的每轮训练中,根据与每个轮次对应的训练状态查询完成更新的所述策略矩阵,确定各工作节点在每个轮次所使用的梯度压缩比例,本发明实施例的技术方案实现了在分布式梯度的压缩训练过程收敛精度和收敛速度的动态平衡。
-
-
-