一种分布式数据传输优化方法、系统及相关设备

    公开(公告)号:CN112073517A

    公开(公告)日:2020-12-11

    申请号:CN202010941036.5

    申请日:2020-09-09

    Abstract: 本发明实施例提供了一种分布式数据传输优化方法、系统及相关设备,用于提高数据传输的效率。本发明实施例方法包括:获取多条训练数据及数据传输策略的超参数空间,每一条所述训练数据包含集群配置的一种数据传输策略及在执行对应的数据传输策略过程中所述集群在单位时间内的网络吞吐量参数,其中,每个初始策略包含一组预设参数字段以及各个预设参数字段的字段值;将所述多个训练数据及数据传输策略的超参数空间代入贝叶斯优化算法模型,计算得到当前训练数据下的最优数据传输策略。

    准确的机器学习异步预测方法及系统、存储介质

    公开(公告)号:CN112070238A

    公开(公告)日:2020-12-11

    申请号:CN202011245061.6

    申请日:2020-11-10

    Inventor: 欧阳亚 任智祥

    Abstract: 本发明公开了一种准确的机器学习异步预测方法及系统、计算机可读存储介质,该方法包括以下步骤:在每次对模型进行训练后,将当前训练次数与相应的验证准确率记录在历史数据中并判断当前是否满足预测执行条件;若当前已满足所述预测执行条件,则采用层级式遍历拟合方法对当前历史数据进行曲线拟合;若已成功对所述当前历史数据进行曲线拟合,则计算每个拟合结果的误差值,并将误差值最小的拟合结果作为最终拟合结果;将待预测训练次数输入至所述最终拟合结果,计算后得到预测准确率,并利用所述预测准确率确定最终准确率。本发明实现了对机器学习模型准确率的精准预测,并且提高了对机器学习模型的准确率进行预测时的效率。

    蛋白质数据多模态特征对齐方法、装置、设备和存储介质

    公开(公告)号:CN119763661A

    公开(公告)日:2025-04-04

    申请号:CN202411732128.7

    申请日:2024-11-27

    Abstract: 本申请实施例提供蛋白质数据多模态特征对齐方法、装置、设备和存储介质,涉及生物医学技术领域。该方法通过利用蛋白质谱图编码器提取掩码谱图的谱图特征,利用蛋白质序列编码器提取掩码序列的序列特征。利用多模态特征提取模型获取谱图特征的谱图自注意力特征和序列特征的序列自注意力特征,根据谱图自注意力特征和序列自注意力特征进行交叉注意力计算,得到谱图交叉注意力特征和序列交叉注意力特征,并根据谱图交叉注意力特征得到谱图对齐特征,根据序列交叉注意力特征得到序列对齐特征。通过这种自上而下的跨模态特征对齐方式,进行高层次特征的聚合与对齐,提升蛋白质质谱数据的多模态特征提取准确性。

    抗体与抗原之间相互作用的预测方法以及相关设备

    公开(公告)号:CN119314547A

    公开(公告)日:2025-01-14

    申请号:CN202411358103.5

    申请日:2024-09-27

    Abstract: 本申请实施例提供了一种抗体与抗原之间相互作用的预测方法以及相关设备,属于数据处理技术领域。该方法包括:获取目标抗体的抗体序列信息和目标抗原的抗原序列信息;提取抗体序列信息中的抗体序列特征,以及提取抗原序列信息中的抗原序列特征;确定抗体序列特征和抗原序列特征之间各自的双向注意力权重,并基于各个双向注意力权重提取抗体序列特征和抗原序列特征之间的双向注意力特征;将抗体序列特征映射到目标抗体的空间结构上,得到抗体结构特征;融合双向注意力特征和抗体结构特征得到目标特征,并基于目标特征确定目标抗体与目标抗原之间相互作用的目标预测结果。本申请能够提高对目标抗体与目标抗原之间相互作用的预测准确度。

    代码自动生成方法和装置、电子设备及存储介质

    公开(公告)号:CN118535137A

    公开(公告)日:2024-08-23

    申请号:CN202410600716.9

    申请日:2024-05-15

    Abstract: 本申请实施例提供了一种代码自动生成方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取意图描述信息;对所述意图描述信息进行解析处理,得到目标数据集和至少一种模态目标表征向量;根据所述模态目标表征向量的种类,确定所述模态目标表征向量对应的第一目标向量;将所述第一目标向量和所述目标数据集输入至预训练的大语言模型中,得到初始代码序列,所述初始代码序列包含至少一个目标元素;按照预设的约束条件对所述初始代码序列中的每个目标元素进行优化,生成目标代码序列,并将所述目标代码序列在用户界面中显示。本申请实施例能够提高可视化生成代码的准确性和便捷性。

    多模态特征融合方法和装置、计算机设备

    公开(公告)号:CN118173174A

    公开(公告)日:2024-06-11

    申请号:CN202410145142.0

    申请日:2024-01-31

    Abstract: 本申请实施例提供了一种多模态特征融合方法和装置、计算机设备,属于深度学习技术领域。该方法包括:获取多个蛋白质样本数据集;其中,所述蛋白质样本数据集包括样本蛋白质序列数据和样本蛋白质图结构数据;根据所述样本蛋白质序列数据和所述样本蛋白质图结构数据训练预设的特征融合模型;获取目标蛋白质序列数据和目标蛋白质图结构数据;通过训练后的所述特征融合模型对所述目标蛋白质序列数据和所述目标蛋白质图结构数据进行特征融合处理,得到目标融合特征;对所述目标融合特征进行可视化处理,得到融合特征分布视图。本申请实施例能够提高数据特征的全面性和丰富性。

    基于生成模型的数据缺失插补方法、电子设备、介质

    公开(公告)号:CN117995276A

    公开(公告)日:2024-05-07

    申请号:CN202410138861.X

    申请日:2024-01-31

    Abstract: 本申请涉及信息技术领域,尤其是涉及一种基于生成模型的数据缺失插补方法,应用于对单细胞测序数据进行数据缺失插补。本申请基于生成模型的单细胞测序缺失信息插补方法,需要先获取单细胞原始测序数据;其中,所述单细胞原始测序数据包括多个原始序列信息;进一步,将多个所述原始序列信息输入生成模型进行缺失信息插补,以获取单细胞目标测序数据;其中,所述生成模型经由包括多个训练序列信息的单细胞训练测序数据进行预先训练。由于缺失信息插补是由经过预先训练的生成模型来完成的,因此本申请基于生成模型的数据缺失插补方法,能够在保证效率的情况下,令缺失信息插补更为精准。

    任务调度方法、电子设备及存储介质

    公开(公告)号:CN117215735A

    公开(公告)日:2023-12-12

    申请号:CN202310969665.2

    申请日:2023-08-01

    Abstract: 本申请公开了一种任务调度方法、电子设备及存储介质,应用于人工智能领域,包括:由计算节点获取训练数据和模型超参数;由计算节点将训练数据和模型超参数输入至训练好的元学习模型,得到模型功耗;由计算节点根据模型功耗得到节点信息,并将节点信息发送至对应的调度节点;由调度节点根据节点信息将计算节点划分为多个分布式集群,以形成多条传输路径;由计算节点获取任务数据,并通过对应的传输路径对任务数据进行任务调度。本申请实施例通过元学习模型对系统功耗进行预测,以使设备节点层的设备节点对应形成有传输路径,从而降低了任务数据在不同计算节点进行计算的功耗,降低了计算负荷,进而提高了能源利用率,提高了任务执行效率。

    分子动力学模拟加速方法、电子设备及存储介质

    公开(公告)号:CN117116368A

    公开(公告)日:2023-11-24

    申请号:CN202310976931.4

    申请日:2023-08-03

    Abstract: 本申请公开了分子动力学模拟加速方法、电子设备及存储介质,涉及生物信息技术领域,其中训练方法包括:获取目标分子基于力场的目标运动轨迹信息;根据所述目标运动轨迹信息,生成每帧原子位置对应的目标内坐标;其中,所述目标内坐标用于表征每个原子之间的依赖关系;将所述目标内坐标输入至预设的所述自编码器进行降维处理,得到目标隐藏向量;将所述目标隐藏向量集输入至预设的时序模型中,得到分子动态变化过程;其中,所述时序模型为Transformer模型。本申请使用Transformer模型代替现有RNN模型对分子时序隐藏向量动态过程进行建模,能够提高模型的推理速度,从而提高了计算效率。

    一种启发式指导的异步历史优化方法及相关设备

    公开(公告)号:CN115633031A

    公开(公告)日:2023-01-20

    申请号:CN202211082723.1

    申请日:2022-09-06

    Abstract: 本发明公开了一种启发式指导的异步历史优化方法及相关设备,所述方法包括:获取集群控制节点和工作节点,控制所述集群控制节点对模型的参数及计算图进行初始化,并将初始化后的数据发送至所述工作节点;控制所述工作节点对所述数据进行训练,通过训练得到的状态表记录信息,并控制所述工作节点将所述状态表发送至所述集群控制节点;在所述集群控制节点接收所述状态表后,控制所述集群控制节点异步进行所述计算图的更新和所述工作节点的参数优化。本发明通过集群控制节点不断整合多轮迭代中各工作节点的状态表并加以存储,通过不断更新计算图使得整个系统效率最优化,并通过还原历史梯度以辅助工作节点更新参数,以提高整个系统的精度。

Patent Agency Ranking