一种构建病原生物基因组数据库的方法及装置

    公开(公告)号:CN115346608B

    公开(公告)日:2023-05-09

    申请号:CN202210743555.X

    申请日:2022-06-27

    IPC分类号: G16B50/30 G06F16/21

    摘要: 一种构建病原生物基因组数据库的方法及装置,该方法包括:获取基因组数据步骤,包括从数据库获取选定的病原生物的基因组数据;同源区域屏蔽步骤,包括对基因组数据进行质粒同源区域屏蔽、宿主源同源区域屏蔽,获得屏蔽同源区域后的基因组数据;融合基因组构建步骤,包括对屏蔽同源区域序列后的基因组数据中的各个基因组构建融合基因组;组库步骤,包括重复所述获取基因组数据步骤、同源区域屏蔽步骤、融合基因组构建步骤,遍历所选定的所有病原生物的基因组数据,汇总所有融合基因组,得到病原生物基因组数据库。该方法构建的数据库具有准确度高,分析时间短的优点。

    一种外泌体miRNA的定量检测方法

    公开(公告)号:CN105063209B

    公开(公告)日:2017-12-12

    申请号:CN201510488030.6

    申请日:2015-08-10

    IPC分类号: C12Q1/68

    摘要: 本发明提供了一种外泌体miRNA的定量检测方法,包括外泌体总RNA提取、3’端和5’端特异性唯一标签接头连接、反转录合成cDNA并进行PCR扩增、miRNA文库的筛选纯化与上机测序、纠错算法的信息分析等步骤。本发明方法基于特异性的唯一标签接头的标记,对每个原始模板进行区分,避免了扩增时分子间存在的偏好性,可以精确检测低于10拷贝以下的miRNA分子,且特异性高,可用于肿瘤源性的外泌体miRNA的检测,神经退行性疾病、心血管疾病,生育健康等领域的检测,可为疾病的早期筛查提供依据,还可应用于其他小RNA精准定量检测领域。具有广阔的应用前景和市场价值。

    一种脱落细胞DNA低频突变富集测序方法

    公开(公告)号:CN105132407A

    公开(公告)日:2015-12-09

    申请号:CN201510488017.0

    申请日:2015-08-10

    IPC分类号: C12N15/10 C12Q1/68

    摘要: 本发明提供了一种脱落细胞DNA的低频突变富集测序方法,包括脱落细胞DNA的提取与DNA的打断,样品DNA文库构建、通用文库TT-COLD PCR扩增富集、探针富集捕获、捕获产物PCR及上机测序、正反双链纠错低频信息分析步骤,具体为基于接头通用引物进行TT COLD PCR对所有类型变异实现第一级突变富集扩增;设计富集探针芯片,针对热点变异将人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,进行第二级富集捕获;文库构建中的插入DNA两端12bp自身序列作为标签进行正反双链纠错比对,提高数据利用率,实现低频精确检测,可以对0.01%低频变异具有高特异性检测。

    一种构建病原生物基因组数据库的方法及装置

    公开(公告)号:CN115346608A

    公开(公告)日:2022-11-15

    申请号:CN202210743555.X

    申请日:2022-06-27

    IPC分类号: G16B50/30 G06F16/21

    摘要: 一种构建病原生物基因组数据库的方法及装置,该方法包括:获取基因组数据步骤,包括从数据库获取选定的病原生物的基因组数据;同源区域屏蔽步骤,包括对基因组数据进行质粒同源区域屏蔽、宿主源同源区域屏蔽,获得屏蔽同源区域后的基因组数据;融合基因组构建步骤,包括对屏蔽同源区域序列后的基因组数据中的各个基因组构建融合基因组;组库步骤,包括重复所述获取基因组数据步骤、同源区域屏蔽步骤、融合基因组构建步骤,遍历所选定的所有病原生物的基因组数据,汇总所有融合基因组,得到病原生物基因组数据库。该方法构建的数据库具有准确度高,分析时间短的优点。

    一种基于半监督学习框架的T细胞受体序列分类方法

    公开(公告)号:CN111489792A

    公开(公告)日:2020-08-04

    申请号:CN202010291254.9

    申请日:2020-04-14

    IPC分类号: G16B40/20 G06K9/62

    摘要: 本发明公开了一种基于半监督学习框架的T细胞受体序列分类方法,选取CDR3β区域作为输入数据,对T细胞受体数据进行特征编码;根据得到的数据,选择支持向量机、随机森林和决策树的监督学习算法分别构造初始分类器C1、C2、C3;对初始分类器C1、C2、C3进行训练得到扩充的新训练集,产生的训练集进行可重复取样获得三个有标记训练集,然后从每个新训练集产生一个分类器,对分类器进行迭代更新;训练完成后,将三个分类器C1、C2、C3通过投票机制作为一个分类器集成进行使用。本发明适用于T细胞受体序列数据难以获得的情况,性能显著优于现有方法。