-
公开(公告)号:CN112669906B
公开(公告)日:2021-09-28
申请号:CN202011360888.1
申请日:2020-11-27
申请人: 深圳华大基因股份有限公司 , 天津华大医学检验所有限公司 , 华大生物科技(武汉)有限公司
摘要: 本发明提供了用于衡量基因组不稳定性的检测方法,包括:(1)获取测序数据;(2)确定BAF数值和LRR数值;(3)进行离群点去除;(4)至少一轮分段处理;(5)断点集合合并;(6)对二级分选片段进行合并处理;(7)对三级分选片段进行过滤和切割处理,(8)同分布检验;(9)确定BAF均值,拷贝数均值;(10)对四级分选片段的BAF均值、拷贝数均值百分比序数进行平面坐标轴聚类作图,以便确定待测样本中肿瘤样本的肿瘤纯度;(11)确定待测样本的倍性校正因子;(12)进行BAF数值校正和拷贝数校正;(13)确定A基因型参数值和B基因型参数值;(14)确定变异类型。
-
公开(公告)号:CN114292900A
公开(公告)日:2022-04-08
申请号:CN202111640673.X
申请日:2021-12-29
申请人: 深圳华大基因股份有限公司 , 天津华大医学检验所有限公司 , 华大生物科技(武汉)有限公司
IPC分类号: C12Q1/6806 , C12Q1/6869 , C40B50/06
摘要: 一种探针混合比例设计方法及混合探针集与测序文库构建方法,探针混合比例设计方法包括:预估步骤,包括提供探针集,根据每种探针集的芯片大小,以及测序深度要求,对探针集的混合比例进行预估;预测序步骤,包括根据预估的混合比例,设置预混比例,将探针集按照预混比例混合,得到预混探针,将预混探针与子文库杂交,进行预测序,获得符合预期的探针混合比例。本发明可以根据产品需求,分别设计多个不同目标区域的探针,可根据测序深度需求进行混合探针配制,从而达到针对不同目标区域同时进行不同测序深度检测的目的,成本低;亦可根据产品目标的变化进行探针配比的调整,或进行不同探针组合方式的检测,灵活性高。
-
公开(公告)号:CN112662767B
公开(公告)日:2021-08-06
申请号:CN202011360943.7
申请日:2020-11-27
申请人: 深圳华大基因股份有限公司 , 天津华大医学检验所有限公司 , 华大生物科技(武汉)有限公司
IPC分类号: C12Q1/6886
摘要: 本发明提出用于衡量基因组不稳定性的试剂盒及其应用,试剂盒含有的探针集合是通过下列步骤确定的:将参考基因组序列划分为多个一级区域,一级区域含有至少一个已知的SNP位点;针对多个一级区域的每一个,进行SNP过滤;选择缺口区域;基于预期间隔,将缺口区域划分为至少一个二级区域;针对至少一个二级区域的每一个,分别进行二级高频SNP搜寻:由二级区域的中心点向两侧至少一次延伸处理;和在至少一次延伸预定长度之后,在所得到的区域中寻找频率最高的SNP,基于一级高频SNP和二级高频SNP汇总作为起始点SNP,确定三级区域;和基于三级区域,构建特异性识别三级区域的探针。利用该方法,能够有效地获得能够有效地用于分析基因组不稳定性的探针组合。
-
公开(公告)号:CN112669906A
公开(公告)日:2021-04-16
申请号:CN202011360888.1
申请日:2020-11-27
申请人: 深圳华大基因股份有限公司 , 天津华大医学检验所有限公司 , 华大生物科技(武汉)有限公司
摘要: 本发明提供了用于衡量基因组不稳定性的检测方法,包括:(1)获取测序数据;(2)确定BAF数值和LRR数值;(3)进行离群点去除;(4)至少一轮分段处理;(5)断点集合合并;(6)对二级分选片段进行合并处理;(7)对三级分选片段进行过滤和切割处理,(8)同分布检验;(9)确定BAF均值,拷贝数均值;(10)对四级分选片段的BAF均值、拷贝数均值百分比序数进行平面坐标轴聚类作图,以便确定待测样本中肿瘤样本的肿瘤纯度;(11)确定待测样本的倍性校正因子;(12)进行BAF数值校正和拷贝数校正;(13)确定A基因型参数值和B基因型参数值;(14)确定变异类型。
-
公开(公告)号:CN112662767A
公开(公告)日:2021-04-16
申请号:CN202011360943.7
申请日:2020-11-27
申请人: 深圳华大基因股份有限公司 , 天津华大医学检验所有限公司 , 华大生物科技(武汉)有限公司
IPC分类号: C12Q1/6886
摘要: 本发明提出用于衡量基因组不稳定性的试剂盒及其应用,试剂盒含有的探针集合是通过下列步骤确定的:将参考基因组序列划分为多个一级区域,一级区域含有至少一个已知的SNP位点;针对多个一级区域的每一个,进行SNP过滤;选择缺口区域;基于预期间隔,将缺口区域划分为至少一个二级区域;针对至少一个二级区域的每一个,分别进行二级高频SNP搜寻:由二级区域的中心点向两侧至少一次延伸处理;和在至少一次延伸预定长度之后,在所得到的区域中寻找频率最高的SNP,基于一级高频SNP和二级高频SNP汇总作为起始点SNP,确定三级区域;和基于三级区域,构建特异性识别三级区域的探针。利用该方法,能够有效地获得能够有效地用于分析基因组不稳定性的探针组合。
-
公开(公告)号:CN116264103A
公开(公告)日:2023-06-16
申请号:CN202111530888.6
申请日:2021-12-14
申请人: 深圳华大基因股份有限公司
IPC分类号: G16B40/00
摘要: 本申请一种构建机器学习模型的方法,所述机器学习模型用于预测新抗原。该方法包括:(1)获取训练集合,所述训练集合中包括多个已知新抗原多肽片段和多个阴性对照多肽片段;(2)针对所述多个已知新抗原多肽片段和多个阴性对照多肽片段的每一个,分别确定下列特征至少之一:癌种及基因特异的泛癌种表达谱、多肽片段的氨基酸理化性质和人类白细胞抗原的权重;(3)利用步骤(2)中所确定的特征,进行机器学习,以便获得可以用于预测新抗原的机器学习模型。本发明方法可获得同一个患者较为全面的DNA、RNA、蛋白质层面的信息,进而准确预测新抗原,也可用于Mbp级别大小的靶向测序试剂盒中的CNV检测方法的开发。
-
-
-
-
-