多倍体转录组亚基因组分型方法及计算机可读存储介质

    公开(公告)号:CN116779035A

    公开(公告)日:2023-09-19

    申请号:CN202310605118.6

    申请日:2023-05-26

    IPC分类号: G16B30/10 G16B20/40 G16B40/00

    摘要: 本发明涉及多倍体转录组亚基因组分型方法及计算机可读存储介质,涉及基因组学领域,包括如下步骤:(1)获取参考物种外群基因序列和待测样本转录组序列,将序列翻译成蛋白序列,进行比对,得到比对结果;(2)设定筛选条件,筛选所述比对结果,获得可信度高的比对结果;(3)将可信度大于预设值的所述比对结果进行连接、整合,得到整合结果;(4)设定过滤参数的阈值,筛选所述整合结果,获得大于等于所述阈值的整合结果并将所述阈值的整合结果按照总得分大小逆序排列;(5)保留总得分最高的一条记录。本发明通过将待测样本转录组序列的CDS序列或者转录本序列比对到参考物种外群基因,来对多倍体转录本进行同源基因簇的划分。

    一种鉴定目标基因的探针序列的设计方法和装置

    公开(公告)号:CN118038980B

    公开(公告)日:2024-10-25

    申请号:CN202410082109.8

    申请日:2024-01-19

    发明人: 赵飞 邓操 郝兆楠

    摘要: 本发明涉及一种鉴定目标基因的探针序列的设计方法和装置,包括如下步骤:(1)将基因组序列分为目标区域序列和非目标区序列;根据所述目标区域序列构建候选探针集;进行比对,获得重复序列探针集;(2)将获得的单拷贝探针集和所述重复序列探针集进行整合,根据设定的目标探针密度值进行过滤,获得最终的探针集。本发明同时使用重复序列探针和单拷贝探针两种类型探针,重复序列探针仅需一个探针,就可以对目标区域多个位点进行染色,使免疫荧光实验成本降低,单拷贝探针可以覆盖重复序列探针不能覆盖的区域,可以提高探针的密度和覆盖范围,提高检测的可靠性和灵敏度。

    组装细胞器基因组和NUMT/NUPT序列的方法、系统和存储介质

    公开(公告)号:CN118038988B

    公开(公告)日:2024-10-01

    申请号:CN202410082105.X

    申请日:2024-01-19

    发明人: 赵飞 邓操 郝兆楠

    IPC分类号: G16B30/10 G16B30/20

    摘要: 本发明涉及组装细胞器基因组和NUMT/NUPT序列的方法、系统和存储介质,涉及基因组序列组装领域,方法包括如下步骤:(1)将下载获得测序数据与参考基因组比对,得到细胞器相关的序列数据;将得到的所述细胞器相关的序列数据进行过滤,得到过滤后的序列数据;将所述过滤后的序列数据进行组装,通过筛选获得最终的细胞器基因组;(2)将所述细胞器相关的序列数据进行组装,得到邻接片段Ⅰ,将所述邻接片段Ⅰ与参考核基因组和/或所述细胞器基因组进行比对,获得NUMT/NUPT序列。本发明利用了NUMT/NUPT起源于细胞器的特点,通过比较NUMT/NUPT序列在核基因组和/或细胞器基因组上的比对情况,能够在组装细胞器基因组的同时,获得NUMT/NUPT序列。

    组装细胞器基因组和NUMT/NUPT序列的方法、系统和存储介质

    公开(公告)号:CN118038988A

    公开(公告)日:2024-05-14

    申请号:CN202410082105.X

    申请日:2024-01-19

    发明人: 赵飞 邓操 郝兆楠

    IPC分类号: G16B30/10 G16B30/20

    摘要: 本发明涉及组装细胞器基因组和NUMT/NUPT序列的方法、系统和存储介质,涉及基因组序列组装领域,方法包括如下步骤:(1)将下载获得测序数据与参考基因组比对,得到细胞器相关的序列数据;将得到的所述细胞器相关的序列数据进行过滤,得到过滤后的序列数据;将所述过滤后的序列数据进行组装,通过筛选获得最终的细胞器基因组;(2)将所述细胞器相关的序列数据进行组装,得到邻接片段Ⅰ,将所述邻接片段Ⅰ与参考核基因组和/或所述细胞器基因组进行比对,获得NUMT/NUPT序列。本发明利用了NUMT/NUPT起源于细胞器的特点,通过比较NUMT/NUPT序列在核基因组和/或细胞器基因组上的比对情况,能够在组装细胞器基因组的同时,获得NUMT/NUPT序列。

    一种渐渗区段鉴定方法及计算机可读存储介质

    公开(公告)号:CN114582427A

    公开(公告)日:2022-06-03

    申请号:CN202210286306.2

    申请日:2022-03-22

    IPC分类号: G16B30/10 G16B45/00

    摘要: 本发明涉及基因组学领域,提供一种基因组渐渗区段鉴定方法,包括利用参考基因组和待检测样本的测序数据,计算基因组各个位点对应的测序深度值;对于同一样本的多个测序数据集,合并相同位点的测序深度值,得到实际深度值,并基于位于同一窗口内的所有位点实际深度值,获得样本全基因组的测序深度的可视化分布,或利用两个样本的可视化深度差值分布,最终通过识别分布中的显著差异区段确定样本基因组中的基因组渐渗区段。本发明通过将整个基因组划分为多个窗口,以窗口的深度值的可视化分布,较为快速且直观地反应哪些区段具有显著差异,从而能够快速对基因组中渐渗区段进行鉴定,并便于后续的基础研究和应用研究。

    一种鉴定目标基因的探针序列的设计方法和装置

    公开(公告)号:CN118038980A

    公开(公告)日:2024-05-14

    申请号:CN202410082109.8

    申请日:2024-01-19

    发明人: 赵飞 邓操 郝兆楠

    摘要: 本发明涉及一种鉴定目标基因的探针序列的设计方法和装置,包括如下步骤:(1)将基因组序列分为目标区域序列和非目标区序列;根据所述目标区域序列构建候选探针集;进行比对,获得重复序列探针集;(2)将获得的单拷贝探针集和所述重复序列探针集进行整合,根据设定的目标探针密度值进行过滤,获得最终的探针集。本发明同时使用重复序列探针和单拷贝探针两种类型探针,重复序列探针仅需一个探针,就可以对目标区域多个位点进行染色,使免疫荧光实验成本降低,单拷贝探针可以覆盖重复序列探针不能覆盖的区域,可以提高探针的密度和覆盖范围,提高检测的可靠性和灵敏度。

    多倍体转录组亚基因组分型方法及计算机可读存储介质

    公开(公告)号:CN116779035B

    公开(公告)日:2024-03-15

    申请号:CN202310605118.6

    申请日:2023-05-26

    IPC分类号: G16B30/10 G16B20/40 G16B40/00

    摘要: 本发明涉及多倍体转录组亚基因组分型方法及计算机可读存储介质,涉及基因组学领域,包括如下步骤:(1)获取参考物种外群基因序列和待测样本转录组序列,将序列翻译成蛋白序列,进行比对,得到比对结果;(2)设定筛选条件,筛选所述比对结果,获得可信度高的比对结果;(3)将可信度大于预设值的所述比对结果进行连接、整合,得到整合结果;(4)设定过滤参数的阈值,筛选所述整合结果,获得大于等于所述阈值的整合结果并将所述阈值的整合结果按照总得分大小逆序排列;(5)保留总得分最高的一条记录。本发明通过将待测样本转录组序列的CDS序列或者转录本序列比对到参考物种外群基因,来对多倍体转录本进行同源基因簇的划分。

    一种渐渗区段鉴定方法及计算机可读存储介质

    公开(公告)号:CN114582427B

    公开(公告)日:2023-04-07

    申请号:CN202210286306.2

    申请日:2022-03-22

    IPC分类号: G16B30/10 G16B45/00

    摘要: 本发明涉及基因组学领域,提供一种基因组渐渗区段鉴定方法,包括利用参考基因组和待检测样本的测序数据,计算基因组各个位点对应的测序深度值;对于同一样本的多个测序数据集,合并相同位点的测序深度值,得到实际深度值,并基于位于同一窗口内的所有位点实际深度值,获得样本全基因组的测序深度的可视化分布,或利用两个样本的可视化深度差值分布,最终通过识别分布中的显著差异区段确定样本基因组中的基因组渐渗区段。本发明通过将整个基因组划分为多个窗口,以窗口的深度值的可视化分布,较为快速且直观地反应哪些区段具有显著差异,从而能够快速对基因组中渐渗区段进行鉴定,并便于后续的基础研究和应用研究。