检测α-珠蛋白基因型的方法和装置

    公开(公告)号:CN117976059B

    公开(公告)日:2024-06-21

    申请号:CN202410392065.9

    申请日:2024-04-02

    IPC分类号: G16B40/00 G16B30/10

    摘要: 本申请涉及一种检测α‑珠蛋白基因型的方法和装置,方法包括:获取检测样本集中各样本的测序数据和参考基因组的比对数据;根据第一目标检测样本集的比对数据确定第一目标检测样本集中各检测样本的α‑珠蛋白基因各特征区域的拷贝数,根据第一目标检测样本集中各检测样本的α‑珠蛋白基因各特征区域的拷贝数确定待分析样本的α‑珠蛋白第一预测基因型;根据第二目标检测样本集的比对数据确定待分析样本α‑珠蛋白基因的融合断点,根据待分析样本α‑珠蛋白基因的融合断点和待分析样本的α‑珠蛋白第一预测基因型确定待分析样本的α‑珠蛋白第二预测基因型。本申请借助于融合断点的检测,可更精确的解读α‑珠蛋白的基因型。

    一种基于二代测序数据对HLA-DRB基因进行分型的方法及应用

    公开(公告)号:CN117542412A

    公开(公告)日:2024-02-09

    申请号:CN202311495522.9

    申请日:2023-11-10

    IPC分类号: G16B20/30 G16B30/10 G16B40/00

    摘要: 本发明公开了一种基于二代测序数据对HLA‑DRB基因进行分型的方法及应用。所述方法包括:测序数据质控,初步分型和校正分型;所述数据质控包括测序reads统计和目标区域统计;所述初步分型包括构建参考基因组,reads比对和权重打分,HLA‑DRB基因拷贝数评估,单个等位基因的筛选和等位基因对的筛选;所述校正分型包括组装consensus序列,序列比对,校正分型结果和提示变异;所述HLA‑DRB基因包括HLA‑DRB3基因、HLA‑DRB4基因和HLA‑DRB5基因中的任意一种或至少两种的组合。本发明能够准确判断包括DRB3/4/5在内的15个基因的拷贝数,与已知分型结果100%一致,再结合等位基因对的打分和筛选规则,DRB3/4/5六位分型结果的准确率分别从85%,98%,96%提升至100%。

    检测α-珠蛋白基因型的方法和装置

    公开(公告)号:CN117976059A

    公开(公告)日:2024-05-03

    申请号:CN202410392065.9

    申请日:2024-04-02

    IPC分类号: G16B40/00 G16B30/10

    摘要: 本申请涉及一种检测α‑珠蛋白基因型的方法和装置,方法包括:获取检测样本集中各样本的测序数据和参考基因组的比对数据;根据第一目标检测样本集的比对数据确定第一目标检测样本集中各检测样本的α‑珠蛋白基因各特征区域的拷贝数,根据第一目标检测样本集中各检测样本的α‑珠蛋白基因各特征区域的拷贝数确定待分析样本的α‑珠蛋白第一预测基因型;根据第二目标检测样本集的比对数据确定待分析样本α‑珠蛋白基因的融合断点,根据待分析样本α‑珠蛋白基因的融合断点和待分析样本的α‑珠蛋白第一预测基因型确定待分析样本的α‑珠蛋白第二预测基因型。本申请借助于融合断点的检测,可更精确的解读α‑珠蛋白的基因型。

    一种检测单亲二倍体和杂合性缺失的方法、装置、存储介质和设备

    公开(公告)号:CN114921536A

    公开(公告)日:2022-08-19

    申请号:CN202210749277.9

    申请日:2022-06-28

    摘要: 本发明公开了一种检测单亲二倍体和杂合性缺失的方法、装置、存储介质和设备。所述方法包括以下步骤:(1)对待测样本的测序数据进行变异检测,得到样本的变异信息文件;(2)筛选样本的SNP位点;(3)进行假设检验,所述假设检验包括单亲二倍体检测和杂合性缺失检测;(4)采用环状二元分割算法进行区域合并;(5)判断是否为单亲二倍体和/或杂合性缺失。本发明建立了一种基于SNP位点检测UPD和AOH的方法,不受限于平台,既可以应用到芯片平台,也可以应用到全外显子测序和全基因组测序,实现了单亲样本检测UPD,能够很好地识别UPD和AOH,而且操作简单,快速方便,满足广泛推广应用的要求。

    真假基因的拷贝数变异的检测方法和装置

    公开(公告)号:CN117935907B

    公开(公告)日:2024-09-03

    申请号:CN202410135524.5

    申请日:2024-01-31

    摘要: 本申请涉及一种真假基因的拷贝数变异的检测方法和装置。本申请通过对高通量测序数据的校正和差异位点的分析,能够极大程度上消除高度同源假基因对结果的影响,并且极大消除NGS测序数据存在的波动问题,因此能够对真假基因外显子级别的拷贝数变化进行判定;通过提取待测样本比对到参考基因组上真基因和假基因的序列,全部比对至真基因,再根据连续目标差异位点中真基因的碱基占该区域所有碱基的碱基比,得到真基因碱基拟拷贝数,从而消除由于真假基因的高度同源性造成的reads比对模糊问题,进一步提高检测真基因的拷贝数变异的准确性。

    真假基因的拷贝数变异的检测方法和装置

    公开(公告)号:CN117935907A

    公开(公告)日:2024-04-26

    申请号:CN202410135524.5

    申请日:2024-01-31

    摘要: 本申请涉及一种真假基因的拷贝数变异的检测方法和装置。本申请通过对高通量测序数据的校正和差异位点的分析,能够极大程度上消除高度同源假基因对结果的影响,并且极大消除NGS测序数据存在的波动问题,因此能够对真假基因外显子级别的拷贝数变化进行判定;通过提取待测样本比对到参考基因组上真基因和假基因的序列,全部比对至真基因,再根据连续目标差异位点中真基因的碱基占该区域所有碱基的碱基比,得到真基因碱基拟拷贝数,从而消除由于真假基因的高度同源性造成的reads比对模糊问题,进一步提高检测真基因的拷贝数变异的准确性。

    一种基于SNP位点检测样本交叉污染的方法及其应用

    公开(公告)号:CN117059164A

    公开(公告)日:2023-11-14

    申请号:CN202311026283.2

    申请日:2023-08-15

    摘要: 本发明公开了一种基于SNP位点检测样本交叉污染的方法及其应用。所述方法包括:筛选SNP位点,模拟数据,构建模型,根据模型进行污染度评估;所述筛选SNP位点包括以下步骤:(1)从数据库下载测序相关的FASTQ文件或bam文件;(2)对文件中每个样本的高通量测序数据进行变异检测,得到样本的变异信息gvcf格式文件;(3)合并所有样本gvcf文件,得到所有样本的vcf格式变异信息;(4)根据杂合状态人群频率和变异等位基因频率筛选SNP位点。本发明通过筛选稳定且携带人群频率高的SNP位点模拟数据,构建模型,根据模型进行污染度评估。这些SNP位点在不同样本中的AF值相对稳定,并集中分布在0,0.5和1附近,污染其它样本后其AF值的剂量变化可以准确反映样本交叉污染的程度,操作简单,快速方便。