用于深度学习的高效体素化
    1.
    发明公开

    公开(公告)号:CN117121110A

    公开(公告)日:2023-11-24

    申请号:CN202280027183.9

    申请日:2022-04-14

    IPC分类号: G16B15/00

    摘要: 本发明所公开的技术涉及高效地确定蛋白质中哪些原子最接近网格中的体素。原子具有三维(3D)原子坐标,体素具有3D体素坐标。本发明所公开的技术生成原子到体素映射,其将基于蛋白质的特定原子的3D原子坐标与网格中的3D体素坐标匹配而选择的包含体素映射到原子中的每个原子。本发明所公开的技术生成体素到原子映射,其将原子的子集映射到体素中的每个体素。映射到网格中的特定体素的原子的子集包括蛋白质中通过原子到体素映射而映射到特定体素的那些原子。本发明所公开的技术包括使用体素到原子映射来为体素中的每个体素确定蛋白质中的最接近原子。

    基于深度学习的深度卷积神经网络训练方法

    公开(公告)号:CN110832596B

    公开(公告)日:2021-03-26

    申请号:CN201880043817.3

    申请日:2018-10-15

    IPC分类号: G16B20/20 G16B40/20

    摘要: 公开的技术涉及构建用于变体分类的基于卷积神经网络的分类器。更具体地,涉及一种在训练数据上使用基于后向传播梯度更新方法训练基于卷积神经网络的分类器,该方法逐步地将基于卷积神经网络的分类器的输出与相应的真实值标签匹配。该基于卷积神经网络的分类器包括残差块组,每个残差块组由残差块中的卷积滤波器数量、残差块的卷积窗口尺寸和残差块的空洞卷积率参数化,所述卷积窗口尺寸在残差块组之间变化,所述空洞卷积率在残差块组之间变化。所述训练数据包括良性训练实例和从良性变体和致病性变体产生的转化的序列对的致病性训练实例。

    基于深度学习的深度卷积神经网络预训练技术

    公开(公告)号:CN111328419A

    公开(公告)日:2020-06-23

    申请号:CN201980003263.9

    申请日:2019-05-09

    IPC分类号: G16B20/00 G16B40/20

    摘要: 所公开的技术包括减少处理氨基酸序列和对应的位置频率矩阵(PFM)的神经网络实现的模型的过拟合的系统和方法。所述系统生成标记为良性的补充训练样例序列对,所述补充训练样例序列对包括按顺序排列的起始位置、目标氨基酸位置和结束位置。补充序列对补充了致病性或良性错义训练样例序列对。其在参考氨基酸序列和替代氨基酸序列中具有相同的氨基酸。所述系统包括用每个补充序列对输入补充训练位置频率矩阵(PFM)的逻辑,所述补充训练PFM与在匹配的起始和结束位置的所述良性或致病性错义训练样例序列对的PFM相同。系统包括通过补充训练样例PFM包含在将训练数据中来削弱在训练所述神经网络实现的模型期间所述训练PFM的训练影响的逻辑。

    基于深度学习的剪接位点分类
    4.
    发明公开

    公开(公告)号:CN110914910A

    公开(公告)日:2020-03-24

    申请号:CN201880043829.6

    申请日:2018-10-15

    IPC分类号: G16B20/00 G16B40/20

    摘要: 公开的技术涉及构造用于变体分类的基于卷积神经网络的分类器。具体地,本发明涉及使用基于反向传播的梯度更新技术在训练数据上训练基于卷积神经网络的分类器,该技术将基于卷积网络网络的分类器的输出与相应的真实值标签逐渐匹配。基于卷积神经网络的分类器包括残差块组,每个残差块组由残差块中的卷积滤波器数量,残差块中的卷积窗口大小和残差块的空洞卷积率来参数化,卷积窗口大小在残差块组之间变化,空洞卷积率在残差块组之间变化。训练数据包括从良性变体和致病性变体产生的良性训练实例和致病性训练实例的转译序列对。

    用于变体分类的深度卷积神经网络

    公开(公告)号:CN110800062A

    公开(公告)日:2020-02-14

    申请号:CN201880043819.2

    申请日:2018-10-15

    IPC分类号: G16B20/20 G16B40/20

    摘要: 公开的技术涉及构建用于变体分类的基于卷积神经网络的分类器。更具体地,涉及使用基于后向传播梯度更新方法在训练数据上训练基于卷积神经网络的分类器,该方法逐步地将基于卷积网络网络的分类器的输出与相应的真实值标签匹配。该基于卷积神经网络的分类器包括残差块组,每个残差块组由残差块中的卷积滤波器数量、残差块的卷积窗口尺寸和残差块的空洞卷积率参数化,所述卷积窗口尺寸在残差块组之间变化,所述空洞卷积率在残差块组之间变化。所述训练数据包括从良性变体和致病性变体产生的转译序列对的良性训练实例和致病性训练实例。

    基于深度学习的变体分类器

    公开(公告)号:CN110832510B

    公开(公告)日:2024-10-22

    申请号:CN201980003259.2

    申请日:2019-01-14

    摘要: 所述公开的技术直接影响测序数据,并且衍生出自己的特征滤波器。其对跨越一个靶碱基位置的多个对位排列的读长进行处理。其将读长的ELEGANT编码和轻量级分析结合起来,使用轻量级硬件来产生较高的查全率和查准率。例如,可以以较高的查全率和查准率在不到10小时的时间内在单个GPU显卡上训练靶碱基变异位点(各具有50至100个读长)的一百万个训练样本。因为配有单个GPU的计算机比较廉价,所以单个GPU显卡最合适,查看遗传数据的用户几乎普遍能承受得起。它可以很容易地在合适的基础平台上使用。

    基于图像确定变体致病性
    7.
    发明公开

    公开(公告)号:CN118648063A

    公开(公告)日:2024-09-13

    申请号:CN202380018815.X

    申请日:2023-01-27

    摘要: 本文描述了用于将蛋白质结构分类的技术(诸如用于将与核苷酸变体相关的蛋白质结构的致病性分类的技术)。这种分类基于从蛋白质结构的三维图像获得的二维图像。关于一些具体实施,本文描述了基于从蛋白质结构的三维图像获得的二维图像的输入将该蛋白质结构分类的多视图卷积神经网络(CNN)。在一些具体实施中,确定变体致病性的计算机实现的方法包括:获取氨基酸的结构再现;捕获该结构再现的包含来自这些氨基酸的目标氨基酸的那些部分的图像;以及基于这些图像,确定将目标氨基酸突变为另选氨基酸的核苷酸变体的致病性。

    基于循环神经网络的变体致病性分类器

    公开(公告)号:CN113627458A

    公开(公告)日:2021-11-09

    申请号:CN202110252738.7

    申请日:2018-10-15

    摘要: 公开的技术涉及构建用于变体分类的基于卷积神经网络的分类器。更具体地,涉及使用基于后向传播梯度更新方法在训练数据上训练基于卷积神经网络的分类器,该方法逐步地将基于卷积网络网络的分类器的输出与相应的真实值标签匹配。该基于卷积神经网络的分类器包括残差块组,每个残差块组由残差块中的卷积滤波器数量、残差块的卷积窗口尺寸和残差块的空洞卷积率参数化,所述卷积窗口尺寸在残差块组之间变化,所述空洞卷积率在残差块组之间变化。所述训练数据包括从良性变体和致病性变体产生的转译序列对的良性训练实例和致病性训练实例。

    用于训练深层卷积神经网络集合的半监督学习

    公开(公告)号:CN110870019A

    公开(公告)日:2020-03-06

    申请号:CN201880043830.9

    申请日:2018-10-15

    IPC分类号: G16B40/20 G16B20/20

    摘要: 公开的技术涉及构建用于变体分类的基于卷积神经网络的分类器。更具体地,涉及使用基于后向传播梯度更新方法在训练数据上训练基于卷积神经网络的分类器,该方法逐步地将基于卷积网络网络的分类器的输出与相应的真实值标签匹配。该基于卷积神经网络的分类器包括残差块组,每个残差块组由残差块中的卷积滤波器数量、残差块的卷积窗口尺寸和残差块的空洞卷积率参数化,所述卷积窗口尺寸在残差块组之间变化,所述空洞卷积率在残差块组之间变化。所述训练数据包括从良性变体和致病性变体产生的转译序列对的良性训练实例和致病性训练实例。

    INDEL致病性确定
    10.
    发明公开

    公开(公告)号:CN118575224A

    公开(公告)日:2024-08-30

    申请号:CN202380018797.5

    申请日:2023-01-27

    IPC分类号: G16B20/20 G16B40/20

    摘要: 本文描述了用于转换ANN的上下文或可通过机器学习训练的另一类型的计算系统的上下文的技术。在一些具体实施中,该技术将计算系统(诸如ANN)的第一上下文转换为该计算系统的第二上下文,该第一上下文用于提供群体的基因组的变异的致病性,该第二上下文用于提供该群体的该基因组的indel的致病性。