在使用终止化学物质的测序中建立分阶段效应模型的方法和系统

    公开(公告)号:CN105683980B

    公开(公告)日:2018-08-24

    申请号:CN201480054627.3

    申请日:2014-10-03

    IPC分类号: G06F19/20

    摘要: 一种用于核酸测序的方法,其包括从接收并且在终止合成测序过程中处理样品核酸的测序仪器接收观测到或测量到的核酸测序数据。所述方法还包括针对所述观测到或测量到的核酸测序数据,通过测定候选序列的预测信号,使用模拟框架来产生一组碱基候选序列。所述模拟框架并入估算推进率(CFR)、估算不完全延伸率(IER)、估算下降率(DR)、估算再活化分子率(RMR)以及估算终止失败率(TFR),所述RMR大于或等于零并且所述TFR小于一。所述方法还包括从所述组碱基候选序列鉴别出一个候选序列,其在对应于所述样品核酸的序列时,使得求解函数最佳化。

    对分隔长片段序列进行组装的方法和装置

    公开(公告)号:CN108350495A

    公开(公告)日:2018-07-31

    申请号:CN201680063769.5

    申请日:2016-02-26

    IPC分类号: C12Q1/6869 G06F19/20

    CPC分类号: C12Q1/68 G06F19/20

    摘要: 本发明涉及对分隔长片段序列进行组装的方法、装置和系统。一种对分隔长片段序列进行组装的方法,包括:(a)通过测序获得读段集,并记录所述读段集中的读段对应的测序孔,一个测序孔包含至少一条长片段序列;(b)利用所述读段及所述读段对应的测序孔,对多个种子序列进行并行延伸,以获得多个序列重叠群,所述多个种子序列通过已知序列确定;(c)基于所述读段、所述序列重叠群以及所述序列重叠群包含的读段对应的测序孔,构建骨架序列,以获得分隔长片段序列的组装结果。

    一种利用支持向量机构建肺癌计算机辅助检测模型的方法

    公开(公告)号:CN108346466A

    公开(公告)日:2018-07-31

    申请号:CN201810058221.2

    申请日:2018-01-22

    IPC分类号: G16H50/20 G06F19/20

    CPC分类号: G16H50/20 G06F19/20

    摘要: 本发明公开一种利用支持向量机构建肺癌计算机辅助检测模型的方法,包括:获取受试者支气管上皮细胞,提取其RNA;根据RNA构建双链cDNA文库并进行测序;将测序结果与参考基因组进行比对,选择受试者的差异显著基因和差异显著变异;将差异显著基因和差异显著变异组合成的向量及表征受试者是否患肺癌的参数作为样本数据;设置采用径向基核函数的支持向量机模型中径向基核函数的协方差和惩罚因子的初始值和调整间隔;将样本数据随机划分为训练集和预测集,对训练集和预测集基于采用径向基核函数的支持向量机模型进行多次训练,根据预测集的结果是否正确分别调整协方差和惩罚因子,将调整后的采用径向基核函数的支持向量机模型作为肺癌计算机辅助检测模型。

    一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法

    公开(公告)号:CN107862179A

    公开(公告)日:2018-03-30

    申请号:CN201711075296.3

    申请日:2017-11-06

    申请人: 中南大学

    IPC分类号: G06F19/24 G06F19/20

    CPC分类号: G06F19/24 G06F19/20

    摘要: 本发明公开了一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,首先计算出疾病功能相似性和miRNA功能相似性;然后利用已知miRNA疾病关联关系构建疾病高斯核相似性和miRNA高斯核相似性;集成疾病功能相似性和高斯核相似性得到最终的疾病相似性,集成miRNA功能相似性和高斯核相似性得到最终的miRNA相似性。最后基于逻辑矩阵分解模型进行预测miRNA和疾病的潜在特征向量,并根据逻辑回归函数来计算miRNA和疾病对的关联关系分数。本发明也能够对全新miRNA的疾病关系进行预测,避免了生物化学实验室所消耗的人力物力财力准确性高。

    基于RNA-seq数据的真核生物可变剪接分析方法和系统

    公开(公告)号:CN107766696A

    公开(公告)日:2018-03-06

    申请号:CN201610707885.8

    申请日:2016-08-23

    发明人: 张翼 程超

    IPC分类号: G06F19/20 G06F19/28

    CPC分类号: G06F19/20 G06F19/28

    摘要: 本发明提供一种基于RNA-seq数据的真核生物可变剪接分析方法和系统。包括通过illumina二代测序平台获取某一具有参考基因组和注释的真核生物的一个或多个样品的转录组原始测序数据;将质量不合格的数据过滤掉,留下的数据作为待分析的数据;接着进行基础分析:将各个转录组样本待分析数据分别比对到所述物种的参考基因组,筛选出唯一比对的结果;计算各样本基因的表达量;筛选出显著差异表达的基因;对差异基因进行功能注释和分析;然后进行可变剪接分析:已知可变剪接事件的鉴定;新的可变剪接事件的鉴定;样品(组)间可变剪接事件差异分析;可变剪接与基因表达关联分析;可变剪接分析结果统计和报表生成;可变剪接可视化图生成。