数据处理方法及装置
    1.
    发明公开

    公开(公告)号:CN108256296A

    公开(公告)日:2018-07-06

    申请号:CN201711499257.6

    申请日:2017-12-29

    IPC分类号: G06F19/20 G06F19/24

    CPC分类号: G16B40/00 G16B25/00

    摘要: 本发明公开了一种数据处理方法及装置。其中,该方法包括:获取对多个孕妇DNA样本进行测序得到的测序数据,通过第一公式计算每个孕妇DNA样本中的胎儿浓度;再利用聚类算法将多个孕妇DNA样本的胎儿浓度h分为女胎样本和男胎样本;分别对女胎样本的胎儿比例和所有样本包括男胎样本和女胎样本的胎儿比例进行拟合得到概率分布模型,得到女胎儿样本的比例h的概率分布模型f0(h)、以及所有样本包括男胎样本和女胎样本的比例h的概率分布模型f1(h);根据贝叶斯分布模型对待检孕妇DNA的常染色体进行贝叶斯分析。本发明解决了上述相关技术中产前检测存在一定的局限性的技术问题。

    数据处理装置
    2.
    发明授权

    公开(公告)号:CN108256296B

    公开(公告)日:2021-05-25

    申请号:CN201711499257.6

    申请日:2017-12-29

    IPC分类号: G16B30/00

    摘要: 本发明公开了一种数据处理装置。其中,该装置用于:获取对多个孕妇DNA样本进行测序得到的测序数据,通过第一公式计算每个孕妇DNA样本中的胎儿浓度;再利用聚类算法将多个孕妇DNA样本的胎儿浓度h分为女胎样本和男胎样本;分别对女胎样本的胎儿比例和所有样本包括男胎样本和女胎样本的胎儿比例进行拟合得到概率分布模型,得到女胎儿样本的比例h的概率分布模型f0(h)、以及所有样本包括男胎样本和女胎样本的比例h的概率分布模型f1(h);根据贝叶斯分布模型对待检孕妇DNA的常染色体进行贝叶斯分析。本发明解决了上述相关技术中产前检测存在一定的局限性的技术问题。

    基于NGS的靶向测序数据模拟方法和装置

    公开(公告)号:CN108229101B

    公开(公告)日:2021-07-06

    申请号:CN201711498731.3

    申请日:2017-12-29

    IPC分类号: G16B5/00 G16B30/00

    摘要: 本发明公开了一种基于NGS的靶向测序数据模拟方法和装置。其中,该方法包括:确定需要生成的模拟测序深度数据集所对应的多个目标区域bin,其中,模拟测序深度数据集包括多个bin中每个bin的模拟的测序深度;确定模拟测序深度数据集的期望值;生成服从以期望值为平均值、以预设方差为方差的正态分布的第一随机数,其中,预设方差为根据实际样本预先确定的方差;生成以第一随机数为平均值和方差的服从泊松分布的多个第二随机数;根据多个调整参数分别对多个第二随机数进行调整,生成模拟测序深度数据集。本发明解决了现有技术中由于需要生成模拟的测序序列数据导致CNV检测耗时较长,占用存储空间大的技术问题。

    基于NGS的靶向测序数据模拟方法和装置

    公开(公告)号:CN108229101A

    公开(公告)日:2018-06-29

    申请号:CN201711498731.3

    申请日:2017-12-29

    IPC分类号: G06F19/20 G06F19/28

    摘要: 本发明公开了一种基于NGS的靶向测序数据模拟方法和装置。其中,该方法包括:确定需要生成的模拟测序深度数据集所对应的多个目标区域bin,其中,模拟测序深度数据集包括多个bin中每个bin的模拟的测序深度;确定模拟测序深度数据集的期望值;生成服从以期望值为平均值、以预设方差为方差的正态分布的第一随机数,其中,预设方差为根据实际样本预先确定的方差;生成以第一随机数为平均值和方差的服从泊松分布的多个第二随机数;根据多个调整参数分别对多个第二随机数进行调整,生成模拟测序深度数据集。本发明解决了现有技术中由于需要生成模拟的测序序列数据导致CNV检测耗时较长,占用存储空间大的技术问题。

    胎儿游离DNA的富集方法
    5.
    发明授权

    公开(公告)号:CN110846382B

    公开(公告)日:2023-02-28

    申请号:CN201911204455.4

    申请日:2019-11-29

    IPC分类号: C12Q1/6806

    摘要: 本发明提供了一种胎儿游离DNA的富集方法。该富集方法包括:采用20~33bp的Y型接头与游离DNA进行连接,得到总游离DNA的连接片段;采用磁珠对总游离DNA的连接片段进行纯化并回收50‑150bp的游离DNA对应的连接片段,得到富集的胎儿游离DNA。该富集方法针对游离DNA中胎儿游离DNA集中在50‑150bp这一特点,通过对二代测序文库构建过程中的操作步骤进行调整,对接头进行截短,并去除大于150bp的游离DNA片段,富集50‑150bp的游离DNA片段,从而实现对于胎儿游离DNA的富集。

    数据处理方法、装置、存储介质及处理器

    公开(公告)号:CN108229099B

    公开(公告)日:2021-01-05

    申请号:CN201711484713.X

    申请日:2017-12-29

    IPC分类号: G16B20/00

    摘要: 本发明公开了一种数据处理方法、装置、存储介质及处理器。其中,该方法包括:获取样本染色体上的基因序列;比对所述基因序列与人类基因组参考序列,确定所述样本染色体中与所述人类基因组参考序列唯一匹配的碱基序列reads;统计每个观测区域bin中所述碱基序列reads的数量,其中,所述观测区域bin为所述样本染色体按照预定分窗条件进行分窗后得到的多个区域bin;根据多个观测区域bin中所述碱基序列reads的数量确定隐马尔科夫模型;根据隐马尔科夫模型确定基因拷贝数变异CNV,其中,所述拷贝数变异CNV包括:至少一个观测区域bin。本发明解决了现有技术无法确定染色体异常诊断中干扰因素的技术问题。

    胎儿游离DNA的富集方法
    7.
    发明公开

    公开(公告)号:CN110846382A

    公开(公告)日:2020-02-28

    申请号:CN201911204455.4

    申请日:2019-11-29

    IPC分类号: C12Q1/6806

    摘要: 本发明提供了一种胎儿游离DNA的富集方法。该富集方法包括:采用20~33bp的Y型接头与游离DNA进行连接,得到总游离DNA的连接片段;采用磁珠对总游离DNA的连接片段进行纯化并回收50-150bp的游离DNA对应的连接片段,得到富集的胎儿游离DNA。该富集方法针对游离DNA中胎儿游离DNA集中在50-150bp这一特点,通过对二代测序文库构建过程中的操作步骤进行调整,对接头进行截短,并去除大于150bp的游离DNA片段,富集50-150bp的游离DNA片段,从而实现对于胎儿游离DNA的富集。

    数据处理方法、装置、存储介质及处理器

    公开(公告)号:CN108229099A

    公开(公告)日:2018-06-29

    申请号:CN201711484713.X

    申请日:2017-12-29

    IPC分类号: G06F19/18

    摘要: 本发明公开了一种数据处理方法、装置、存储介质及处理器。其中,该方法包括:获取样本染色体上的基因序列;比对所述基因序列与人类基因组参考序列,确定所述样本染色体中与所述人类基因组参考序列唯一匹配的碱基序列reads;统计每个观测区域bin中所述碱基序列reads的数量,其中,所述观测区域bin为所述样本染色体按照预定分窗条件进行分窗后得到的多个区域bin;根据多个观测区域bin中所述碱基序列reads的数量确定隐马尔科夫模型;根据隐马尔科夫模型确定基因拷贝数变异CNV,其中,所述拷贝数变异CNV包括:至少一个观测区域bin。本发明解决了现有技术无法确定染色体异常诊断中干扰因素的技术问题。

    一种非整倍性生物信息的分析方法和分析系统

    公开(公告)号:CN107133495B

    公开(公告)日:2018-07-13

    申请号:CN201710310451.9

    申请日:2017-05-04

    摘要: 本发明公开了一种非整倍性生物信息的分析方法和分析系统。其中,1)构建参考数据库异;2)计算UR ratio;3)构建参考数据库统计学参数;4)Z值计算;5)按照上述减少母体自身染色体存在微缺失或微重复造成的胎儿染色体非整倍体假阳性的方法减少母体自身染色体存在微缺失或微重复造成的胎儿染色体非整倍体假阳性;6)按照上述胎儿DNA浓度预测模型的构建方法构建的胎儿DNA浓度预测模型预测胎儿DNA浓度;7)计算胎儿每条染色体的DNA数量占总体DNA的百分比:8)常染色体非整倍体的判断:9)性染色体异常判断。应用本发明的技术方案,极大地提高了分析的准确性。