一种构建病原生物基因组数据库的方法及装置

    公开(公告)号:CN115346608A

    公开(公告)日:2022-11-15

    申请号:CN202210743555.X

    申请日:2022-06-27

    IPC分类号: G16B50/30 G06F16/21

    摘要: 一种构建病原生物基因组数据库的方法及装置,该方法包括:获取基因组数据步骤,包括从数据库获取选定的病原生物的基因组数据;同源区域屏蔽步骤,包括对基因组数据进行质粒同源区域屏蔽、宿主源同源区域屏蔽,获得屏蔽同源区域后的基因组数据;融合基因组构建步骤,包括对屏蔽同源区域序列后的基因组数据中的各个基因组构建融合基因组;组库步骤,包括重复所述获取基因组数据步骤、同源区域屏蔽步骤、融合基因组构建步骤,遍历所选定的所有病原生物的基因组数据,汇总所有融合基因组,得到病原生物基因组数据库。该方法构建的数据库具有准确度高,分析时间短的优点。

    一种构建病原生物基因组数据库的方法及装置

    公开(公告)号:CN115346608B

    公开(公告)日:2023-05-09

    申请号:CN202210743555.X

    申请日:2022-06-27

    IPC分类号: G16B50/30 G06F16/21

    摘要: 一种构建病原生物基因组数据库的方法及装置,该方法包括:获取基因组数据步骤,包括从数据库获取选定的病原生物的基因组数据;同源区域屏蔽步骤,包括对基因组数据进行质粒同源区域屏蔽、宿主源同源区域屏蔽,获得屏蔽同源区域后的基因组数据;融合基因组构建步骤,包括对屏蔽同源区域序列后的基因组数据中的各个基因组构建融合基因组;组库步骤,包括重复所述获取基因组数据步骤、同源区域屏蔽步骤、融合基因组构建步骤,遍历所选定的所有病原生物的基因组数据,汇总所有融合基因组,得到病原生物基因组数据库。该方法构建的数据库具有准确度高,分析时间短的优点。

    一种mNGS鉴定微生物的数据处理方法、装置及存储介质

    公开(公告)号:CN114242173B

    公开(公告)日:2023-05-16

    申请号:CN202111579973.1

    申请日:2021-12-22

    IPC分类号: G16B50/00 G16B30/10

    摘要: 本申请公开了一种mNGS鉴定微生物的数据处理方法、装置及存储介质。本申请的数据处理方法包括,利用Linux系统提供的内存映射/dev/shm加载数据库;在读取数据库之前,先检查数据库大小,如小于硬盘中原始加载的数据库大小,则通过虚拟内存触碰方式将其激活,使得加载数据库完整的缓存于内存中;采用内存映射方式加载参考基因组;采用Linux管道输出和读入,减少临时文件,提高分析速度。本申请方法,通过对数据处理过程中限制速度的关键步骤进行优化,提高了mNGS鉴定微生物的速度和效率,降低了对高性能硬件设备的依赖性,使得mNGS鉴定微生物仅采用现有常规的硬件设备就能实现快速、高效、准确的微生物分析和鉴定。

    一种检测样本污染率的方法及装置

    公开(公告)号:CN115083529B

    公开(公告)日:2023-03-14

    申请号:CN202210811098.3

    申请日:2022-07-11

    IPC分类号: G16B50/30 G16B20/30

    摘要: 一种检测样本污染率的方法及装置,该方法包括:位点MAF提取步骤,包括提取待测样本的测序数据中的位点在数据库中的MAF;过滤步骤,包括过滤去除不符合条件的SNP位点;错误率计算步骤,包括计算不同碱基替换的错误率;似然值计算步骤,包括计算待测样本在不同污染率下的似然值;候选污染率计算步骤,包括根据每个SNP位点计算的似然值对数与位点深度计算加权平均值,选择加权平均值最大的似然值对应的污染率为候选污染率;优化步骤,包括根据优化函数优化候选污染率,获得最终的样本污染率。该方法的分析结果可信度高。

    一种差异性甲基化区域筛选方法及其装置

    公开(公告)号:CN114171115A

    公开(公告)日:2022-03-11

    申请号:CN202111340427.2

    申请日:2021-11-12

    IPC分类号: G16B20/00

    摘要: 一种差异性甲基化区域筛选方法及其装置,筛选方法包括:CpG簇的提取步骤;CpG簇的筛选步骤;肿瘤组织特异的差异性甲基化区域筛选步骤;肿瘤cfDNA特异的差异性甲基化区域筛选步骤,以健康样本的cfDNA测序数据和患病样本的cfDNA测序数据作为背景数据集,对高差异性甲基化区域、低差异性甲基化区域进行过滤,获得过滤后的高差异性甲基化区域、低差异性甲基化区域。本发明基于CpG位点距离与甲基化信号连锁性的高度相关性,动态地将基因组划分为具有连锁关系的CpG簇,结合数据库中的肿瘤群体数据和健康个体数据,筛选获得肿瘤cfDNA中特异的差异性甲基化区域,有效提高甲基化标记物筛选的灵敏性与特异性。

    一种基于甲基化测序数据进行变异检测的方法及装置

    公开(公告)号:CN113674802A

    公开(公告)日:2021-11-19

    申请号:CN202110960293.8

    申请日:2021-08-20

    IPC分类号: G16B20/50 G16B20/30 G16B30/10

    摘要: 一种基于甲基化测序数据进行变异检测的方法及装置,该方法包括:候选变异提取步骤,包括提取待测样本测序数据中的候选变异;比对文件提取步骤,包括锁定候选变异所在的基因组区域,提取基因组区域位置的比对文件;重比对步骤,包括将所述比对文件进行重比对,生成重比对之后的比对文件,即重比对文件;鉴定及修正步骤,包括对重比对文件进行转化位点的鉴定,修正转化位点的碱基信息,并重新生成修正碱基之后的比对文件,即修正比对文件;变异检测步骤,包括根据修正比对文件,进行变异检测,获得检测结果。通过重比对、转化位点的鉴定及修复,实现基于甲基化测序数据进行变异检测。