-
公开(公告)号:CN111710360A
公开(公告)日:2020-09-25
申请号:CN202010458976.9
申请日:2020-05-27
Applicant: 广州大学
Abstract: 本发明公开了一种预测蛋白质序列的方法,包括以下步骤:获取原始数据,构建原始数据集;对原始数据集中的蛋白质序列进行特征提取,所提取的特征值包括蛋白质序列中氨基酸的组成值、转换值以及分布值;对提取的特征值进行降维处理,生成特征值的降维序列;根据特征值的降维序列对G蛋白偶联受体进行预测,并将预测结果进行可视化展示;选择氨基酸的组成值、转换值以及分布值作为特征值,使预测结果具有针对性,同时使得预测结果更为准确;并通过降维方法将提取出来的冗余的蛋白质序列样本的特征进行筛选,提升了蛋白质序列区分的效率;最后直观清晰地展示预测结果。本发明可广泛应用于大数据或机器学习技术领域。
-
公开(公告)号:CN111710360B
公开(公告)日:2023-04-25
申请号:CN202010458976.9
申请日:2020-05-27
Applicant: 广州大学
Abstract: 本发明公开了一种预测蛋白质序列的方法,包括以下步骤:获取原始数据,构建原始数据集;对原始数据集中的蛋白质序列进行特征提取,所提取的特征值包括蛋白质序列中氨基酸的组成值、转换值以及分布值;对提取的特征值进行降维处理,生成特征值的降维序列;根据特征值的降维序列对G蛋白偶联受体进行预测,并将预测结果进行可视化展示;选择氨基酸的组成值、转换值以及分布值作为特征值,使预测结果具有针对性,同时使得预测结果更为准确;并通过降维方法将提取出来的冗余的蛋白质序列样本的特征进行筛选,提升了蛋白质序列区分的效率;最后直观清晰地展示预测结果。本发明可广泛应用于大数据或机器学习技术领域。
-