一种基因组拷贝数变异检测整合算法
摘要:
本发明提出了一种基因组拷贝数变异检测整合算法,待测样本的测序序列进行数据筛选,保留高质量的测序序列,比对至相应参考基因组,使用固定长度的滑动窗口将比对后的高质量测序序列分成非重叠的片段,并计算每个窗口片段的原始Read数目的平均值作为该窗片段的深度信号;采用平均值校正法来纠正GC含量偏差,采用平滑分割算法将所有的经GC校正后的深度信号进行平滑,将相邻的窗口深度值一致的窗片段归并成大的片段;将一维空间中的平滑深度信号变换成二维平面,对二维平面建立高斯混合模型,采用步长搜索求解混合高斯模型的参数,对大于阈值概率的基因组片段的片段序列进行断点分析,计算相应序列处的拷贝数的增加或减少。
公开/授权文献
0/0