一种低甲基化水平的差异甲基化位点识别方法

    公开(公告)号:CN109887543B

    公开(公告)日:2022-12-09

    申请号:CN201910145275.7

    申请日:2019-02-27

    Applicant: 中南大学

    Abstract: 本发明提供了一种低甲基化水平的差异甲基化位点识别方法,包括以下步骤:S1、获取一种低甲基化水平疾病的多组甲基化芯片数据样本。S2、对多组甲基化芯片数据样本进行预处理,得到甲基化芯片数据集。S3、根据位点维度,将甲基化芯片数据集划分为多个甲基化芯片数据子集;将每一个甲基化芯片数据子集输入构建随机森林模型,迭代进行特征选择,输出甲基化芯片数据的疾病相关特征集。S4、对甲基化芯片数据的疾病相关特征集进行线性拟合处理,之后通过假设检验筛选出具有统计显著性的特征。能识别出传统方法不能筛选出的差异甲基化位点,并且找到的差异甲基化位点具有更好的类别判定性能和显著性意义。

    一种低甲基化水平的差异甲基化位点识别方法

    公开(公告)号:CN109887543A

    公开(公告)日:2019-06-14

    申请号:CN201910145275.7

    申请日:2019-02-27

    Applicant: 中南大学

    Abstract: 本发明提供了一种低甲基化水平的差异甲基化位点识别方法,包括以下步骤:S1、获取一种低甲基化水平疾病的多组甲基化芯片数据样本。S2、对多组甲基化芯片数据样本进行预处理,得到甲基化芯片数据集。S3、根据位点维度,将甲基化芯片数据集划分为多个甲基化芯片数据子集;将每一个甲基化芯片数据子集输入构建随机森林模型,迭代进行特征选择,输出甲基化芯片数据的疾病相关特征集。S4、对甲基化芯片数据的疾病相关特征集进行线性拟合处理,之后通过假设检验筛选出具有统计显著性的特征。能识别出传统方法不能筛选出的差异甲基化位点,并且找到的差异甲基化位点具有更好的类别判定性能和显著性意义。

Patent Agency Ranking