-
公开(公告)号:CN116705168A
公开(公告)日:2023-09-05
申请号:CN202310681068.X
申请日:2023-06-08
Applicant: 广州大学
IPC: G16B40/00 , G06N3/0455 , G06N3/084
Abstract: 本说明书实施例提供了一种基于深度自编码器的疾病相关miRNAs预测方法及系统,其中,方法包括:从TCGA数据库中获取样本的miRNAs表达谱数据,对获取的miRNAs表达谱数据分别进行标准化处理;所述样本包括疾病样本和正常样本;利用矩阵分解方法,对标准化处理后的miRNAs表达谱数据中的零值进行填充,使用填充后的miRNAs表达谱数据训练深度自编码器模型;基于所述深度自编码器模型训练反向编码器,根据所述反向编码器获得疾病样本的miRNA表达谱数据与疾病相关性大小,得到与疾病相关性高的miRNA。本发明能够发现新的疾病相关miRNAs,促进疾病的诊断及治疗。
-
公开(公告)号:CN114661870B
公开(公告)日:2024-08-06
申请号:CN202210380861.1
申请日:2022-04-12
Applicant: 广州大学
Abstract: 本发明公开了一种基于miRNAs表达谱和自然语言模型的癌症分类方法,包括如下步骤:对癌症miRNA表达数据集样本的预处理;根据miRNA的表达数据,构建邻居miRNA频数数据表;遍历每一个miRNA表达样本,基于统计语言模型方法分别计算每个样本在癌症组和正常组中的统计概率;根据待测样本在癌症组和正常组中的统计概率特征,构建分类器预测待测样本所属类别。本发明基于自然语言模型的癌症分类方法,具有高效预测且计算简单的优点。本方法着重考虑样本内miRNA分子表达值的排名先后顺序,无需关注miRNA分子在样本间的表达差异。本发明不受基因组测序批次效应的影响,对于癌症样本的分类具有广泛的适用性。
-
公开(公告)号:CN114661870A
公开(公告)日:2022-06-24
申请号:CN202210380861.1
申请日:2022-04-12
Applicant: 广州大学
Abstract: 本发明公开了一种基于miRNAs表达谱和自然语言模型的癌症分类方法,包括如下步骤:对癌症miRNA表达数据集样本的预处理;根据miRNA的表达数据,构建邻居miRNA频数数据表;遍历每一个miRNA表达样本,基于统计语言模型方法分别计算每个样本在癌症组和正常组中的统计概率;根据待测样本在癌症组和正常组中的统计概率特征,构建分类器预测待测样本所属类别。本发明基于自然语言模型的癌症分类方法,具有高效预测且计算简单的优点。本方法着重考虑样本内miRNA分子表达值的排名先后顺序,无需关注miRNA分子在样本间的表达差异。本发明不受基因组测序批次效应的影响,对于癌症样本的分类具有广泛的适用性。
-
-