一种基于皮尔逊相关性和共线性的特征选择方法

    公开(公告)号:CN119785880A

    公开(公告)日:2025-04-08

    申请号:CN202411875721.7

    申请日:2024-12-19

    Abstract: 本发明提出了一种基于皮尔逊共线性选择(PCS)的方法,用于从高维基因组数据中筛选与目标表型密切相关的特征。PCS方法通过计算特征间的皮尔逊相关系数,有效去除冗余特征,减少多重共线性问题,显著提高了特征选择的质量,并增强了模型预测的稳定性。该方法特别适用于基因型与表型关联分析等领域,能够优化数据处理与分析过程。此外,PCS方法具备较强的跨种群适应性。通过在多个种群的数据集上进行特征选择与预测验证,证明了多个模型使用PCS方法能够在不同数据集间保持一致的良好预测性能,展现了出色的泛化能力。该方法不仅能够有效预测单一种群的表型,还能成功应用于其他种群的预测任务,进一步拓宽了其在精准医疗和作物育种等领域的应用范围。相较于传统特征选择方法,PCS方法在降低特征冗余的同时,能够更好地保留与目标表型强相关的特征,从而显著提升了模型的预测精度,为基因组数据分析提供了更加高效且可靠的技术支持。

Patent Agency Ranking