-
公开(公告)号:CN107273713B
公开(公告)日:2020-06-02
申请号:CN201710382371.4
申请日:2017-05-26
申请人: 浙江工业大学
摘要: 一种基于TM‑align的多域蛋白模板搜索方法,首先,从蛋白质库中提取多域蛋白建立多域蛋白质库;然后,基于蛋白质结构比对工具TM‑align计算模板蛋白对于每个单域蛋白的局部比对得分,并取最高值为模板的局部得分;其次,选出局部得分最高的前500个模板进行全局评价,按照单域蛋白的比对顺序分多种情况进行评价,在评价过程中,模板中的各残基禁止重复比对,并且遵循查询蛋白中的各域的实际顺序比对,选出各种比对情况中全局比对得分最高值为模板的最终得分;最后,根据最终得分对进行排名,选择最终得分最高的模板为最终模板。本发明可以较快得到最佳模板,且可以获取域之间方向信息,模板质量较高。
-
公开(公告)号:CN107609340B
公开(公告)日:2020-05-05
申请号:CN201710605462.X
申请日:2017-07-24
申请人: 浙江工业大学
IPC分类号: G16B15/00
摘要: 一种多域蛋白距离谱构建方法,采用蛋白质比对工具对多域蛋白中各单域蛋白与模板的比对进行一对一打分,然后计算整个模板的综合得分;选取综合得分最高的部分模板蛋白提取所比对上的各残基之间的距离构建距离谱,并通过一系列条件来控制距离谱的质量,以保证距离谱的精确性。通过实际构象中各残基之间的距离与距离谱之间的平均误差对组装构象进行打分。本发明提供一种能够提高打分函数精确性的多域蛋白距离谱构建方法。
-
公开(公告)号:CN107145764B
公开(公告)日:2019-07-30
申请号:CN201710148984.1
申请日:2017-03-14
申请人: 浙江工业大学
IPC分类号: G16B15/20
摘要: 一种双重分布估计引导的蛋白质构象空间搜索方法,同时启动多条Monte Carlo轨迹,并根据当前所有轨迹个体信息构建能量分布概率模型和历史接受概率模型,根据两个概率模型选择一条Monte Carlo轨迹执行下一次搜索,使得搜索过程主要向能量更低的区域进行,并以一定的概率在高能量区域进行搜索,在一定程度上克服了能量模型不精确的问题,最终得到一系列近天然态构象。本发明在蛋白质结构预测中应用,可以得到预测精度较高、复杂度较低的构象。
-
公开(公告)号:CN106503486B
公开(公告)日:2019-04-23
申请号:CN201610846217.3
申请日:2016-09-23
申请人: 浙江工业大学
IPC分类号: G16B20/40
摘要: 一种基于多阶段子群协同进化策略的差分进化蛋白质结构从头预测方法,包括以下步骤:在差分进化算法框架下,采用Rosetta Score3粗粒度知识能量模型来降低构象空间维数;将进化种群依相似度划分为多个子种群,子种群之间协同进化,可以提高种群个体多样性;进化过程被划分为三个阶段,在不同的阶段采用不同的变异交叉策略,可以避免早熟收敛问题;结合差分进化算法较强的全局搜索能力,可以对构象空间进行有效的采样,搜索得到较高精度的近天然态构象。本发明基于差分进化算法,提出一种构象空间搜索维数较低、收敛速度较快、预测精度较高的基于多阶段子群协同进化策略的差分进化蛋白质结构从头预测方法。
-
公开(公告)号:CN109509510A
公开(公告)日:2019-03-22
申请号:CN201810762915.4
申请日:2018-07-12
申请人: 浙江工业大学
IPC分类号: G16B30/10
摘要: 一种基于多种群系综变异策略的蛋白质结构预测方法,在进化算法框架下,在进化算法框架下,首先,把种群平均分为四个子种群,并且通过各子种群中的构象协同合作,对每一个子种群分别设计不同的变异策略;其次根据Rosetta能量函数score3、距离误差系数以及蒙特卡洛概率接收准则对构象进行选择,来指导构象的更新过程,不仅能够缓解能量函数不精确的问题,而且可以引导算法采样得到能量更低且结构更合理的构象,同时提高采样效率。本发明提供一种采样效率和预测精度都较高的基于多种群系综变异策略的蛋白质结构预测方法。
-
公开(公告)号:CN109448786A
公开(公告)日:2019-03-08
申请号:CN201810994693.9
申请日:2018-08-29
申请人: 浙江工业大学
摘要: 一种下界估计动态策略蛋白质结构预测方法,在进化算法框架下,首先,建立两组策略池,每组策略池有三种不同的变异策略,根据不同的进化代数选用不同策略池里的变异策略;其次根据下界估计函数来对变异构象进行选择,进一步用Rosetta能量函数score3、蒙特卡洛玻尔兹曼接收准则对构象进行最终选择,下界估计动态策略蛋白质结构预测方法不仅可以增强种群的多样性,而且能够缓解能量函数不精确的问题,引导算法采样得到能量更低且结构更合理的构象,提高采样效率。本发明提供一种采样效率和预测精度都较高的下界估计动态策略蛋白质结构预测方法。
-
公开(公告)号:CN109448785A
公开(公告)日:2019-03-08
申请号:CN201810994130.X
申请日:2018-08-29
申请人: 浙江工业大学
IPC分类号: G16B20/00
摘要: 一种使用拉氏图增强Loop区域结构的蛋白质结构预测方法,首先,根据目标蛋白质的序列信息以及残基类型获得相对应的拉氏图;其次,使用片段长度为3和9的片段组装分别在不同阶段对构象空间进行搜索,片段长度的不同有利于构象的采样多样性;然后,在第四阶段中加入了Monte Carlo方法,提高了算法搜索构象空间的能力;最后通过局部扰动阶段,对构象的Loop区域进行增强,使用了片段库以外的信息,有效地增强了构象的多样性,通过对Loop区域的残基的结构进行增强,还可以减小构象搜索空间,从而获得更多近天然态的构象。本发明采样能力较好、预测精度较高的使用拉氏图增强Loop区域结构的蛋白质结构预测方法。
-
公开(公告)号:CN109347903A
公开(公告)日:2019-02-15
申请号:CN201810985953.6
申请日:2018-08-28
申请人: 浙江工业大学
IPC分类号: H04L29/08 , H04L12/24 , G06F16/2458
CPC分类号: H04L41/044 , H04L41/145 , H04L67/12 , H04L67/18 , H04L67/26
摘要: 一种基于GIS系统的校园消息推送优化方法,先根据校园成员的个人信息使用决策树分类算法将成员分类到相应的群体中,进而基于GIS系统统计校园成员的校园信息行为,进行特征分类,给予每种特征以一定的权重,然后通过大数据技术去除校园推送消息中的冗余信息,并根据校园成员的特征分类结果进行分类,进而构建分析模型,最后根据权重以及兴趣特征对不同的校园成员推送不同的消息。本发明能够满足不同校园成员的推送消息需求。
-
公开(公告)号:CN106372456B
公开(公告)日:2019-01-22
申请号:CN201610735964.X
申请日:2016-08-26
申请人: 浙江工业大学
摘要: 一种基于深度学习Residue2vec的蛋白质结构预测方法,给定输入序列信息,将PDB网站上已知的蛋白质结构看成语料库进行训练,将结构已知的蛋白质分割成长度为n的残基,通过CBOW模型结合Huffman编码,获取每个残基在向量空间中的表示,通过计算残基向量之间的距离来判断残基间的相似性,从而获取查询序列每个残基位置上的前N个片段结构,构成了Residue2vec的片段库;然后对查询序列进行随机折叠构成初始构象;之后随机选取其中一个长度为n的残基,与片段库中的片段进行二面角的替换;进而比较能量,若能量减小则接收构象,若能量增大则以Metropolis准则接收构象,通过不断迭代最终获得亚稳态构象。本发明查询序列中匹配度较高、预测精度较高。
-
-
-
-
-
-
-
-
-