微生物目标片段中多拷贝区域的识别方法、装置及应用
摘要:
本发明提供一种微生物目标片段中多拷贝区域的识别方法,至少包括以下步骤:S100:寻找候选多拷贝区域:对微生物目标片段进行内部比对,寻找相似性满足预设值的待测序列对应的区域作为候选多拷贝区域,所述相似性是指待测序列的覆盖率与匹配率的乘积;S200:验证获得多拷贝区域:获得候选多拷贝区域拷贝数的中值;若候选多拷贝区域拷贝数的中值大于1,则记为多拷贝区域。与文献数据库对比,本发明的微生物目标片段中多拷贝区域的识别方法准确性高,灵敏度高,识别出未发现的多拷贝区域;可在组装不完整的基序中寻找重复序列;与16srRNA相比更加全面,16srRNA不都是多拷贝。
0/0