-
公开(公告)号:CN106960135B
公开(公告)日:2018-06-26
申请号:CN201710160731.6
申请日:2017-03-17
申请人: 明码(上海)生物科技有限公司
IPC分类号: G06F19/20
摘要: 本发明公开了一种靶向基因二代测序数据自动化分析系统,包括:待分析数据存储单元,用于存储待分析数据,如该单元有数据,则进入分析方式决策单元;分析方式决策单元,用于决定数据通过何种方式分析,分别进入云端数据分析单元或备用数据分析单元;云端数据分析单元,将上传到云端的待分析数据,以样本为单位,进行数据分析;备用数据分析单元,在本地分析平台上进行数据分析;分析结果存储单元,用于存储来自云端数据分析单元和备用数据分析单元质量检测合格数据的分析结果。本发明解决了现有技术存在人工操作较多,不适用于大规模数据全自动分析的问题,并采用了云端和本地计算双平台自动切换策略,保证了自动化分析的稳健性。
-
公开(公告)号:CN109887546B
公开(公告)日:2019-12-27
申请号:CN201910077588.3
申请日:2019-01-28
申请人: 明码(上海)生物科技有限公司
摘要: 本发明公开了一种基于二代测序技术的单基因或多基因拷贝数检测系统及方法,利用基于正则化线性回归模型(LASSO)的机器学习算法以及层次转移模型推断单基因或者多基因外显子的拷贝数变异,包括依次连接的:序列比对模块、去除重复序列模块、计算覆盖深度模块、标准化覆盖深度模块、正则化线性回归训练模块(LASSO线性回归训练模块)、覆盖深度预测模块、断点检测和log2Ratio值矫正模块、拷贝数状态推断模块。本发明利用机器学习方法对大规模二代靶向捕获测序数据进行训练,结合层次转移模型,目的是降低由于批次效应造成的技术和生物学误差,从而达到更好的拷贝数检测的准确性和精度。
-
公开(公告)号:CN109887546A
公开(公告)日:2019-06-14
申请号:CN201910077588.3
申请日:2019-01-28
申请人: 明码(上海)生物科技有限公司
摘要: 本发明公开了一种基于二代测序技术的单基因或多基因拷贝数检测系统及方法,利用基于正则化线性回归模型(LASSO)的机器学习算法以及层次转移模型推断单基因或者多基因外显子的拷贝数变异,包括依次连接的:序列比对模块、去除重复序列模块、计算覆盖深度模块、标准化覆盖深度模块、正则化线性回归训练模块(LASSO线性回归训练模块)、覆盖深度预测模块、断点检测和log2Ratio值矫正模块、拷贝数状态推断模块。本发明利用机器学习方法对大规模二代靶向捕获测序数据进行训练,结合层次转移模型,目的是降低由于批次效应造成的技术和生物学误差,从而达到更好的拷贝数检测的准确性和精度。
-
公开(公告)号:CN109584957A
公开(公告)日:2019-04-05
申请号:CN201910083308.X
申请日:2019-01-28
申请人: 明码(上海)生物科技有限公司
IPC分类号: G16B20/10
摘要: 本发明公开了一种用于捕获α地中海贫血相关基因拷贝数检测试剂盒,包括捕获探针,所述捕获探针由17个主要探针和对照探针组成,17个主要探针是针对HBZ/HBZP1/HBA2/HBA1/HBQ1/HS-40基因区域设计的,所述捕获探针对目标区域进行捕获,测序,通过数据分析估算HBA1基因和HBA2基因外显子1和外显子3的拷贝数,并对缺失类型进行基因分型。经实验验证,本发明试剂盒能准确检测捕获α地中海贫血相关基因拷贝数并进行缺失类型分型,检测灵敏度为100%,特异性为99.89%,精度为96.55%,准确性为99.90%。解决了现有方法错误率较高、稳定性不好、通量较小、特异性差,尤其是对HBA1和HBA2基因的高度同源性欠缺考虑等问题,还用于解决HBA1和HBA2基因高度同源性以及缺失类型种类多且难以区分等问题。
-
公开(公告)号:CN109584957B
公开(公告)日:2020-04-17
申请号:CN201910083308.X
申请日:2019-01-28
申请人: 明码(上海)生物科技有限公司
IPC分类号: G16B20/10
摘要: 本发明公开了一种用于捕获α地中海贫血相关基因拷贝数检测试剂盒,包括捕获探针,所述捕获探针由17个主要探针和对照探针组成,17个主要探针是针对HBZ/HBZP1/HBA2/HBA1/HBQ1/HS‑40基因区域设计的,所述捕获探针对目标区域进行捕获,测序,通过数据分析估算HBA1基因和HBA2基因外显子1和外显子3的拷贝数,并对缺失类型进行基因分型。经实验验证,本发明试剂盒能准确检测捕获α地中海贫血相关基因拷贝数并进行缺失类型分型,检测灵敏度为100%,特异性为99.89%,精度为96.55%,准确性为99.90%。解决了现有方法错误率较高、稳定性不好、通量较小、特异性差,尤其是对HBA1和HBA2基因的高度同源性欠缺考虑等问题,还用于解决HBA1和HBA2基因高度同源性以及缺失类型种类多且难以区分等问题。
-
公开(公告)号:CN106960135A
公开(公告)日:2017-07-18
申请号:CN201710160731.6
申请日:2017-03-17
申请人: 明码(上海)生物科技有限公司
IPC分类号: G06F19/20
CPC分类号: G06F19/20
摘要: 本发明公开了一种靶向基因二代测序数据自动化分析系统,包括:待分析数据存储单元,用于存储待分析数据,如该单元有数据,则进入分析方式决策单元;分析方式决策单元,用于决定数据通过何种方式分析,分别进入云端数据分析单元或备用数据分析单元;云端数据分析单元,将上传到云端的待分析数据,以样本为单位,进行数据分析;备用数据分析单元,在本地分析平台上进行数据分析;分析结果存储单元,用于存储来自云端数据分析单元和备用数据分析单元质量检测合格数据的分析结果。本发明解决了现有技术存在人工操作较多,不适用于大规模数据全自动分析的问题,并采用了云端和本地计算双平台自动切换策略,保证了自动化分析的稳健性。
-
公开(公告)号:CN106834502B
公开(公告)日:2018-06-26
申请号:CN201710129136.6
申请日:2017-03-06
申请人: 明码(上海)生物科技有限公司
IPC分类号: C12Q1/6869 , G06F19/24
摘要: 本发明公开了一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒和方法。该试剂盒包括捕获探针,捕获探针由4个主要探针和相关对照探针组成。4个主要探针为:捕获SMN2基因外显子7的探针,如SEQ ID NO:1所示;捕获SMN2基因外显子7的探针,如SEQ ID NO:2所示;捕获SMN1基因外显子7的探针,如SEQ ID NO:3所示;捕获SMN1基因外显子7的探针,如SEQ ID NO:4所示;捕获探针对目标区域进行捕获,测序,通过本发明数据分析方法进一步估算SMN1和SMN2基因外显子7的拷贝数。本发明解决了现有方法测序深度不均一、错误率较高、稳定性不好、通量较小等问题。
-
公开(公告)号:CN106834502A
公开(公告)日:2017-06-13
申请号:CN201710129136.6
申请日:2017-03-06
申请人: 明码(上海)生物科技有限公司
CPC分类号: C12Q1/6869 , G06F19/24 , C12Q2535/122 , C12Q2565/519 , C12Q2537/16 , C12Q2537/165
摘要: 本发明公开了一种基于基因捕获和二代测序技术的脊髓性肌萎缩症相关基因拷贝数检测试剂盒和方法。该试剂盒包括捕获探针,捕获探针由4个主要探针和相关对照探针组成。4个主要探针为:捕获SMN2基因外显子7的探针,如SEQ ID NO:1所示;捕获SMN2基因外显子7的探针,如SEQ ID NO:2所示;捕获SMN1基因外显子7的探针,如SEQ ID NO:3所示;捕获SMN1基因外显子7的探针,如SEQ ID NO:4所示;捕获探针对目标区域进行捕获,测序,通过本发明数据分析方法进一步估算SMN1和SMN2基因外显子7的拷贝数。本发明解决了现有方法测序深度不均一、错误率较高、稳定性不好、通量较小等问题。
-
-
-
-
-
-
-