一种基于DNA测序数据的同源重组缺陷判定方法
摘要:
本发明公开了一种基于DNA测序数据的同源重组缺陷判定方法,获取特征属性;提取有效数据;基于三重学习法框架,考虑到较好的泛化能力、较高的准确度和对多维特征属性的处理效率,选择三个不同的基分类器H1、H2、H3;对H1、H2、H3进行迭代训练得到扩充训练集,由此对模型进行更新,完成训练过程;使用所训练的模型对未标记样本集U进行标记,根据标记结果完成HRD状态的判定。本发明解决了使用单一或少量基因组不稳定性状态等局部特征来进行HRD状态判定的局限性,克服临床上已知HRD状态的样本数量极少的难点,实现已有样本数据下的多特征属性的学习,能够提高HRD判定方法的性能。
公开/授权文献
0/0