-
公开(公告)号:CN114661870B
公开(公告)日:2024-08-06
申请号:CN202210380861.1
申请日:2022-04-12
Applicant: 广州大学
Abstract: 本发明公开了一种基于miRNAs表达谱和自然语言模型的癌症分类方法,包括如下步骤:对癌症miRNA表达数据集样本的预处理;根据miRNA的表达数据,构建邻居miRNA频数数据表;遍历每一个miRNA表达样本,基于统计语言模型方法分别计算每个样本在癌症组和正常组中的统计概率;根据待测样本在癌症组和正常组中的统计概率特征,构建分类器预测待测样本所属类别。本发明基于自然语言模型的癌症分类方法,具有高效预测且计算简单的优点。本方法着重考虑样本内miRNA分子表达值的排名先后顺序,无需关注miRNA分子在样本间的表达差异。本发明不受基因组测序批次效应的影响,对于癌症样本的分类具有广泛的适用性。
-
公开(公告)号:CN114661870A
公开(公告)日:2022-06-24
申请号:CN202210380861.1
申请日:2022-04-12
Applicant: 广州大学
Abstract: 本发明公开了一种基于miRNAs表达谱和自然语言模型的癌症分类方法,包括如下步骤:对癌症miRNA表达数据集样本的预处理;根据miRNA的表达数据,构建邻居miRNA频数数据表;遍历每一个miRNA表达样本,基于统计语言模型方法分别计算每个样本在癌症组和正常组中的统计概率;根据待测样本在癌症组和正常组中的统计概率特征,构建分类器预测待测样本所属类别。本发明基于自然语言模型的癌症分类方法,具有高效预测且计算简单的优点。本方法着重考虑样本内miRNA分子表达值的排名先后顺序,无需关注miRNA分子在样本间的表达差异。本发明不受基因组测序批次效应的影响,对于癌症样本的分类具有广泛的适用性。
-