一种构建病原生物基因组数据库的方法及装置

    公开(公告)号:CN115346608B

    公开(公告)日:2023-05-09

    申请号:CN202210743555.X

    申请日:2022-06-27

    IPC分类号: G16B50/30 G06F16/21

    摘要: 一种构建病原生物基因组数据库的方法及装置,该方法包括:获取基因组数据步骤,包括从数据库获取选定的病原生物的基因组数据;同源区域屏蔽步骤,包括对基因组数据进行质粒同源区域屏蔽、宿主源同源区域屏蔽,获得屏蔽同源区域后的基因组数据;融合基因组构建步骤,包括对屏蔽同源区域序列后的基因组数据中的各个基因组构建融合基因组;组库步骤,包括重复所述获取基因组数据步骤、同源区域屏蔽步骤、融合基因组构建步骤,遍历所选定的所有病原生物的基因组数据,汇总所有融合基因组,得到病原生物基因组数据库。该方法构建的数据库具有准确度高,分析时间短的优点。

    一种鉴定肿瘤纯度样本的模型构建方法及应用

    公开(公告)号:CN110808081B

    公开(公告)日:2022-07-08

    申请号:CN201910933916.5

    申请日:2019-09-29

    IPC分类号: G16B5/00 G16B20/20

    摘要: 本发明属于肿瘤纯度检测领域,具体涉及一种鉴定肿瘤纯度样本的模型构建方法及应用,包括:基于已知肿瘤纯度肿瘤样本的靶向捕获测序数据,获取包括如下的指标数据:体细胞拷贝数变化幅度、杂合子种系单核苷酸变异和体细胞等位基因变异分数;将上述指标数据与已知纯度肿瘤样本的肿瘤纯度进行关联构建鉴定模型;上述方法中,结合体细胞突变和生殖细胞变异,综合体细胞拷贝数变化幅度、杂合子种系单核苷酸变异和体细胞等位基因变异分数等指标数据构建的模型,解决了区间芯片捕获测序如panel测序突变位点少肿瘤纯度鉴定困难的问题,可以比较准确地识别出低纯度样本,实现各个不同指标之间多重相互交叉确认,可信度较高。

    预测肿瘤组织cfDNA的方法及系统

    公开(公告)号:CN112086129B

    公开(公告)日:2021-04-06

    申请号:CN202011009109.3

    申请日:2020-09-23

    IPC分类号: G16B30/00

    摘要: 一种预测肿瘤组织cfDNA的方法及系统,该方法包括:待测样本特征提取步骤,包括提取待测样本的cfDNA测序数据的末端特征和Kmer频数特征;预测步骤,包括通过模型,对所述待测样本的cfDNA测序数据的末端特征和Kmer频数特征进行分析,根据分析结果,预测所述待测样本是否为健康样本或肿瘤样本。通过提取末端特征和Kmer频数特征,构建模型,显著提高肿瘤组织cfDNA预测的特异性和灵敏度。

    一种基于测序数据识别染色质开放区域的方法及装置

    公开(公告)号:CN111724860B

    公开(公告)日:2021-03-16

    申请号:CN202010561435.9

    申请日:2020-06-18

    IPC分类号: G16B30/00

    摘要: 本申请公开了一种基于测序数据识别染色质开放区域的方法及装置。本申请方法包括,测序数据处理步骤,根据cfDNA全基因组测序数据在参考基因组的位置,计算窗口化保护评分和测序深度;初步筛选步骤,定位WPS的波峰和波谷,将相邻波峰的间距大于阈值的区域作为候选染色质开放区域;波峰参数筛选步骤,根据候选染色质开放区域两侧各3‑9个WPS的波峰面积、波峰夹角,波峰间距、波峰高度和波峰宽度进一步筛选;染色质开放区域识别步骤,通过cfDNA平均标准化测序深度验证,准确识别染色质开放区域。本申请方法,无需借助参考图谱,不依赖任何试剂或试验,仅通过数据分析即可简单、有效的获得染色质开放区域,提高了检测质量和效率。

    心血管系统细胞特异性的甲基化标志物及其应用

    公开(公告)号:CN117778561A

    公开(公告)日:2024-03-29

    申请号:CN202311837691.6

    申请日:2023-12-27

    IPC分类号: C12Q1/6883

    摘要: 一种细胞特异性的甲基化标志物及其组合方式,以及一种确定样本中目的细胞来源的游离DNA量的方法。应用所述标志物及其组合方式,结合所述方法,可以体现来源于不同个体和不同时期的不同样本之间存在的差异。基于此效用,不仅可以用于疾病或损伤状态的早期检测和评估,也可用于器官慢性疾病的进展监测、健康管理,以及用药指导。

    一种测序数据GC偏向性校正的方法及其装置

    公开(公告)号:CN111627498B

    公开(公告)日:2022-10-04

    申请号:CN202010436420.X

    申请日:2020-05-21

    IPC分类号: G16B20/30 G16B30/10 G16B40/00

    摘要: 一种测序数据GC偏向性校正的方法,包括如下步骤:获取基因组的测序数据比对数据可供计算分析区间R;从可供计算分析区间R中获取最高频率片段长度数F;通过对区间R进行不重复的抽样,抽样数N小于或等于区间R的总长度;计算每一个抽出的位置P对应的如下A)‑B)的参数:A)位置P到位置P+F之间的序列中的G碱基和C碱基的个数之和Gp;B)位置P上比对片段数Fp,所述比对片段的起始位置为位置P;汇总每一个位置上述的数值,对每一个Gp值进行分层统计,最终计算每一个Gp值对应的GC片段比例;将测序深度除以Rgc进行测序深度计算修正。本发明的GC偏向性校正方法构建的模型,修正效果好。