识别序列之间相似序列或序列内部重复序列的计算机装置、方法和计算机程序产品

    公开(公告)号:CN118522352A

    公开(公告)日:2024-08-20

    申请号:CN202410470515.1

    申请日:2024-04-18

    IPC分类号: G16B30/10 G06F17/16

    摘要: 本发明公开了识别序列之间相似序列或序列内部重复序列的计算机装置、方法和计算机程序产品。本发明的计算机装置或计算机程序产品通过建立待分析序列的置换矩阵,根据置换矩阵填充得到待分析序列得分矩阵H,得分矩阵H中每一个元素Hij的值为选择该元素左上角Hi‑1,j‑1的元素值与该元素位置的置换矩阵得分求和的值和0两者之间的最大值;然后通过选择得分矩阵H中元素值的最大值进行回溯,检测并定位基因或氨基酸序列之间相似序列或序列内部重复序列。本发明可以快速批量识别并定位序列内无限条局部重复序列片段,可应用于海量的生物序列的重复分析,并可应用于检测融合基因。