基于多距离谱嵌入融合的单细胞甲基化数据聚类方法

    公开(公告)号:CN114298201A

    公开(公告)日:2022-04-08

    申请号:CN202111589061.2

    申请日:2021-12-23

    IPC分类号: G06K9/62 G16B40/00

    摘要: 本发明公开了一种基于多距离谱嵌入融合的单细胞甲基化数据聚类方法,获取待聚类的细胞的单细胞甲基化数据并进行二值化处理,根据得到的单细胞甲基化数据计算得到细胞之间的余弦距离矩阵、海明距离矩阵和皮尔逊距离矩阵,利用光谱嵌入方法根据三个距离矩阵获取细胞的三个低维谱嵌入表示矩阵,将三个低维谱嵌入表示矩阵按列合并得到特征矩阵,将特征矩阵中的行向量作为细胞的特征表示向量,两两计算细胞间特征表示向量之间的欧氏距离,得到甲基化距离矩阵,基于甲基化距离矩阵进行层次聚类,获取细胞聚类结果。本发明通过融合多个距离矩阵的低维谱嵌入成分,提升了单细胞甲基化数据聚类的准确性。