长序列数据预测方法、装置、计算机设备、介质和产品

    公开(公告)号:CN117932280B

    公开(公告)日:2024-06-25

    申请号:CN202410339838.7

    申请日:2024-03-25

    申请人: 之江实验室

    摘要: 本申请涉及一种长序列数据预测方法、装置、计算机设备、介质和产品。方法包括:从待预测的第一天文数据中提取第二天文数据和第三天文数据,第二天文数据包括有序变化的文本数据和时间列,第三天文数据包括无序变化的文本数据和时间列;对第二天文数据进行缩放和/或平移直至其均值和/或标准差分布达到预设状态;根据第二天文数据对预设的线性函数进行前向传播和反向传播,并根据线性函数输出第二天文数据在未来时间的数据,线性函数用于表征第二天文数据中前后相邻两个时间列的文本数据之间的映射关系;根据第二天文数据在未来时间的数据与第三天文数据,得到第一天文数据在未来时间列的数据。采用本方法能够兼顾长时间序列预测的效率和精度。

    一种模型训练方法和基于分子能量信息的任务执行方法

    公开(公告)号:CN117393075A

    公开(公告)日:2024-01-12

    申请号:CN202311702625.8

    申请日:2023-12-12

    申请人: 之江实验室

    摘要: 本说明书公开了一种模型训练方法和基于分子能量信息的任务执行方法。该模型训练的方法包括:获取指定化合物分子的表征数据,并确定能够指定化合物分子的三维分子图信息;将三维分子图信息输入预测模型中,确定指定化合物分子对应的三维分子图特征;根据三维分子图特征,预测指定化合物分子对应的分子能量信息;以最小化预测出的分子能量信息与指定化合物分子对应的实际分子能量信息之间的偏差为优化目标,对模型进行训练。使得后续在以分子结构特征预测整体分子的能量的过程中,可以通过该预测模型实现快速、准确地预测任意结构下的化合物分子的整体能量,提高分子能量预测的准确性。

    一种模型训练的方法以及分子结构信息的推荐方法及装置

    公开(公告)号:CN116597892B

    公开(公告)日:2024-03-19

    申请号:CN202310560994.1

    申请日:2023-05-15

    申请人: 之江实验室

    摘要: 本说明书公开了一种模型训练的方法以及分子结构信息的推荐方法及装置,通过获取到的数据集,构建出指定蛋白降解靶向嵌合体的三维分子图信息,该三维分子图信息充分的表征出指定蛋白降解靶向嵌合体的分子结构的各种特征,将该三维分子图信息输入到预测模型中后,预测模型会根据三维分子图信息,来预测与指定蛋白降解靶向嵌合体组合成具有预设药物功能的分子片段的片段信息,作为目标片段信息,进而根据预测出的目标片段信息以及与指定蛋白降解靶向嵌合体对应的标签分子片段的片段信息之间的偏差,对预测模型进行训练,使得后续在预测分子结构的过程中,可以通过该预测模型实现快速、准确的分子片段预测,从而提高了分子片段探索的效率以及准确性。

    一种模型训练的方法以及分子性质信息的预测方法及装置

    公开(公告)号:CN116524998A

    公开(公告)日:2023-08-01

    申请号:CN202310714271.2

    申请日:2023-06-15

    申请人: 之江实验室

    IPC分类号: G16B15/30 G16B15/20 G16B40/00

    摘要: 本说明书公开了一种模型训练的方法以及分子性质信息的预测方法及装置,通过构建出指定蛋白降解靶向嵌合体分子的三维分子图数据,该三维分子图数据充分的表征出指定蛋白降解靶向嵌合体分子的分子结构的特征,将该三维分子图数据输入到预测模型中后,预测模型会根据三维分子图数据,来预测指定蛋白降解靶向嵌合体分子的分子性质信息,进而根据预测出的分子性质信息以及指定蛋白降解靶向嵌合体分子对应的实际分子性质信息之间的偏差,对预测模型进行训练,使得后续在预测分子性质信息的过程中,可以通过该预测模型实现快速、准确的分子性质信息的预测,从而提高了分子性质信息的探索效率以及准确性。

    一种模型训练的方法以及分子结构信息的推荐方法及装置

    公开(公告)号:CN116597892A

    公开(公告)日:2023-08-15

    申请号:CN202310560994.1

    申请日:2023-05-15

    申请人: 之江实验室

    摘要: 本说明书公开了一种模型训练的方法以及分子结构信息的推荐方法及装置,通过获取到的数据集,构建出指定蛋白降解靶向嵌合体的三维分子图信息,该三维分子图信息充分的表征出指定蛋白降解靶向嵌合体的分子结构的各种特征,将该三维分子图信息输入到预测模型中后,预测模型会根据三维分子图信息,来预测与指定蛋白降解靶向嵌合体组合成具有预设药物功能的分子片段的片段信息,作为目标片段信息,进而根据预测出的目标片段信息以及与指定蛋白降解靶向嵌合体对应的标签分子片段的片段信息之间的偏差,对预测模型进行训练,使得后续在预测分子结构的过程中,可以通过该预测模型实现快速、准确的分子片段预测,从而提高了分子片段探索的效率以及准确性。

    长序列数据预测方法、装置、计算机设备、介质和产品

    公开(公告)号:CN117932280A

    公开(公告)日:2024-04-26

    申请号:CN202410339838.7

    申请日:2024-03-25

    申请人: 之江实验室

    摘要: 本申请涉及一种长序列数据预测方法、装置、计算机设备、介质和产品。方法包括:从待预测的第一天文数据中提取第二天文数据和第三天文数据,第二天文数据包括有序变化的文本数据和时间列,第三天文数据包括无序变化的文本数据和时间列;对第二天文数据进行缩放和/或平移直至其均值和/或标准差分布达到预设状态;根据第二天文数据对预设的线性函数进行前向传播和反向传播,并根据线性函数输出第二天文数据在未来时间的数据,线性函数用于表征第二天文数据中前后相邻两个时间列的文本数据之间的映射关系;根据第二天文数据在未来时间的数据与第三天文数据,得到第一天文数据在未来时间列的数据。采用本方法能够兼顾长时间序列预测的效率和精度。