一种基于后缀数组的模糊串联重复序列识别方法

    公开(公告)号:CN104156636A

    公开(公告)日:2014-11-19

    申请号:CN201410368238.X

    申请日:2014-07-30

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于后缀数组的模糊串联重复序列识别方法,将得到的DNA碱基序列以字符串形式输入计算机中;基于字典排序算法对基因序列进行处理,生成相应的后缀数组;基于后缀数组得到最大公共前缀列;基于精确串联重复识别算法得到序列的最大串联重复;基于改进的FFT变换得到序列的最优偏移量;基于动态规划算法对序列进行比对;基于模糊串联重复识别算法得到序列的模糊串联重复。本发明能快速识别与准确分析基因组中的重复序列,找出序列的模糊串联重复。

Patent Agency Ranking