基于能量的原子结构与电子密度图多目标优化拟合预测方法

    公开(公告)号:CN111968707B

    公开(公告)日:2022-06-17

    申请号:CN202010789510.7

    申请日:2020-08-07

    发明人: 张彪 沈红斌

    IPC分类号: G16B40/00 G16B45/00 G16B15/20

    摘要: 一种基于能量的原子结构与电子密度图多目标优化拟合预测方法,根据蛋白质三维结构和电子密度图,通过组建预测结构和电子密度图的基准数据集,生成初始模型;然后利用电子密度图的信息将预测的原子结构初步的移动到密度图的中心,生成N个初始模型;再通过多目标粒子群优化算法选取帕雷托集合并利用Knee算法从中选取最优模型,通过计算得到原子结构和电子密度图之间的拟合结果。本发明能够解决仅通过最小化单个能量函数而导致的潜在偏差问题。

    全长环状RNA上蛋白绑定核苷酸位点的预测方法

    公开(公告)号:CN114187963A

    公开(公告)日:2022-03-15

    申请号:CN202111501583.2

    申请日:2021-12-09

    摘要: 一种全长circRNA上蛋白绑定核苷酸位点的预测方法,将全长circRNA切分成片段后输入至一维CNN网络后,将得到的局部高级抽象特征分别输入至BiGRU网络和Transformer编码器的双分支网络,分别得到输入数据的长依赖表示特征和基于全局注意力的circRNA序列表示,经拼接后输入MLP分类器,最后通过中值滤波根据相邻核苷酸的结合信息去除假结合核苷酸降低假阳率,通过分数二值化策略获得预测的结合核苷酸,通过积分梯度识别关键序列内容,得到预测的全长circRNA与RBP结合基序。本发明能够以核苷酸分辨率探索全长circRNA上RBP结合情况,准确预测RBP结合核苷酸并检测其结合基序。

    一种空间转录组细胞聚类、分析方法

    公开(公告)号:CN114091603A

    公开(公告)日:2022-02-25

    申请号:CN202111385235.3

    申请日:2021-11-22

    摘要: 一种空间转录组细胞聚类方法,包括步骤:对于空间转路组中每个细胞基因表达进行预处理;根据所述空间转路组的细胞坐标生成邻接矩阵A,获得空间转录组细胞的图结构表示,由细胞特征矩阵X表示细胞基因表达,将邻接矩阵A和细胞特征矩阵X输入经过训练的图卷积神经网络模型DGI;所述图卷积神经网络模型DGI输出具有空间信息的结点特征表示;对所述结点特征表示采用降维、聚类算法处理后,识别、获得所述空间转录组细胞类型。

    基于深度学习的蛋白质卷曲螺旋结构特征预测实现方法

    公开(公告)号:CN113724780A

    公开(公告)日:2021-11-30

    申请号:CN202111084566.3

    申请日:2021-09-16

    摘要: 一种基于深度学习的蛋白质卷曲螺旋结构特征预测实现方法,使用两层卷积网络和两层双向长短时记忆网络分别提取序列的局部特征以及全局特征,经拼接后通过残差网络预处理,再分别经卷曲螺旋区域预测网络、七元标记位置预测网络以及寡聚体状态预测网络预测得到卷曲螺旋的卷曲螺旋区域、七元标记位置以及寡聚体状态。本发明采用自注意力机制使得模型自动关注卷曲螺旋中对预测至关重要的位置,并采用多类别交叉熵作为损失函数。模型最终的损失函数是三个网络损失函数的加权,以及网络参数的正则项。

    基于傅里叶功率谱的冷冻电镜单颗粒图像配准方法

    公开(公告)号:CN112614170A

    公开(公告)日:2021-04-06

    申请号:CN202110022500.5

    申请日:2021-01-08

    发明人: 陈宇轩 沈红斌

    IPC分类号: G06T7/33 G06F17/14

    摘要: 一种基于傅里叶功率谱的冷冻电镜单颗粒图像配准方法,通过对待测冷冻电镜单颗粒图片集进行功率谱高通滤波器参数估计,然后计算待配准图像的傅里叶功率谱,并提取特征点,根据特征点对待配准图像进行反旋转后对图像进行矫正;基于傅里叶功率谱的旋转周期性,再次根据特征点计算另一相对旋转角后进行相对反旋转和相对矫正,最后根据矫正以及相对矫正得到的矫正图像与目标图像进行相似性计算,取相似性最高的矫正图像作为配准参数结果。本发明使用傅里叶功率谱域的分析对噪声、颗粒以及背景进行了有效分离,同时基于快速傅里叶变换的有效实现大大提高了算法的计算性能,无需进行迭代修正可直接计算出配准参数,使得配准无论从计算速度还是精度与鲁棒性上都得到了提升。

    冷冻电镜三维密度图分辨率检测方法

    公开(公告)号:CN107092790B

    公开(公告)日:2019-07-09

    申请号:CN201710255814.3

    申请日:2017-04-19

    发明人: 沈红斌 杨宇蛟

    IPC分类号: G16C20/70 G06T17/00

    摘要: 本发明提供一种冷冻电镜三维密度图分辨率检测方法,包括步骤:输入冷冻电镜三维密度图和纯噪声三维密度图;生成掩膜集;利用各掩膜分别对纯噪声三维密度图进行分割分别获得第一膜内数据和第一膜外数据;计算第一膜内噪声谱功率和第一膜外噪声谱功率;计算获得线性参数集;利用各掩膜分别对冷冻电镜三维密度图进行分割分别获得第二膜内数据和第二膜外数据;根据第二膜内数据、第二膜外数据和线性参数集计算获得各掩膜所对应的第二膜内数据谱信噪比曲线图;根据第二膜内数据谱信噪比曲线图获得分辨率集,根据分辨率集绘制分辨率集三维曲面图;获得全局分辨率值。本发明的一种冷冻电镜三维密度图分辨率检测方法,具有简单、直观、操作便捷的优点。

    一种蛋白质氨基酸关联矩阵预测方法

    公开(公告)号:CN109637580A

    公开(公告)日:2019-04-16

    申请号:CN201811484434.8

    申请日:2018-12-06

    IPC分类号: G16B15/20

    摘要: 一种蛋白质氨基酸关联矩阵预测方法,包括:S1、组建蛋白质氨基酸关联图预测训练数据集;S2、在训练集中从蛋白质氨基酸序列中提取6种特征,并将每一个序列的6种特征合并,同时生成标签文件和权重掩模矩阵;S3、在改进的残差网络的基础上使用合并的特征、标签文件和权重掩模矩阵进行训练;S4、根据测试序列搜索同源序列列表,并得到这些同源序列的合并特征、标签文件、和权重掩模矩阵;S5、在步骤S3中得到的模型的基础上,使用步骤S4中得到的同源序列的合并特征、标签文件和权重掩模矩阵进行进一步训练;S6、根据测试氨基酸序列得到测试序列的合并特征,然后输入步骤S5中得到的预测模型进行预测。

    基于代价敏感LSTM网络的蛋白质域检测方法

    公开(公告)号:CN106295242A

    公开(公告)日:2017-01-04

    申请号:CN201610629963.7

    申请日:2016-08-04

    发明人: 沈红斌 陈晓

    IPC分类号: G06F19/16 G06F19/24

    CPC分类号: G06F19/16 G06F19/24

    摘要: 一种基于代价敏感LSTM网络的蛋白质域检测方法,采用双向LSTM网络作为蛋白质域检测的模型;提出一个代价敏感的损失函数,为正负样本的错分赋予不同的代价;同时提出一种更新损失函数中代价权重的方法,对于任意给定的初始值,能够在网络训练过程中自适应地更新代价权重。采用平滑、删除、合并操作对模型的原始输出进行后处理。本发明优点包括:检测模型采用双向LSTM网络,对蛋白质序列的长程相关性进行有效建模;使用代价敏感的损失函数训练模型,适应蛋白质域数据集不平衡的特征;引入代价权重自适应更新方法,适用于任何数据集;对模型输出进行后处理,减少假阳性结果。