一种基于大数据的绒山羊基因分析方法及系统

    公开(公告)号:CN118629493B

    公开(公告)日:2024-11-01

    申请号:CN202411110382.3

    申请日:2024-08-14

    发明人: 双金 许浩

    摘要: 本发明公开了一种基于大数据的绒山羊基因分析方法及系统,涉及生物信息学和生态保护技术领域,该发明通过全基因组测序技术,全面获取绒山羊的基因信息,避免了传统小规模样本采集的局限性。对绒山羊的历史健康信息进行系统收集,使得健康数据更加完整和精确。通过大数据技术,去除基因数据中的噪声和错误序列;通过构建综合数据库,将环境、基因和健康数据进行相关联整合,建立预测基因多样化分析模型。能够全面评估绒山羊群体的香农多样性指数Xnd、平均杂合指数Zhz、环境优渥指数Hjsy、遗传分化指数Ycf和绒山羊生理指数Slzs。相比传统单一维度的分析方法,本发明能够多维度综合考虑各种因素对绒山羊群体的影响,评估结果更加全面和科学。

    氨基酸变异注释方法、装置、存储介质和电子设备

    公开(公告)号:CN118866087A

    公开(公告)日:2024-10-29

    申请号:CN202410767804.8

    申请日:2024-06-14

    IPC分类号: G16B20/20 G16B30/10 G16B20/50

    摘要: 本公开的实施例提供的氨基酸变异注释方法、装置、存储介质和电子设备,包括:对于待注释变异序列信息集合中的待注释变异序列信息,执行以下氨基酸变异注释操作:根据待注释变异序列信息和相应参考序列信息生成待注释单核苷酸多态性SNP信息集合;基于待注释变异序列信息中满足预设注释条件的碱基位点生成候选注释变异碱基位点集合;基于待注释SNP信息集合中的完整密码子SNP信息生成待注释完整密码子SNP信息集合;基于完整密码子SNP信息集合以及待注释变异序列信息和相应参考序列信息,确定待注释变异序列信息相对相应参考序列信息的氨基酸变异注释结果,不是通过单个的SNP氨基酸获得氨基酸变异注释结果。

    一种绵羊育种基因数据分析方法及系统

    公开(公告)号:CN118841077A

    公开(公告)日:2024-10-25

    申请号:CN202411311589.7

    申请日:2024-09-20

    发明人: 双金 许浩

    IPC分类号: G16B20/20 G16H50/30

    摘要: 本发明涉及基因分析技术领域,且公开了一种绵羊育种基因数据分析方法及系统,通过系统化的数据获取、处理、筛选、匹配和育种步骤,实现了从基因数据到育种决策的全链条优化。这种方法不仅提高了优质基因的识别精度,还优化了基因匹配和配对策略,使得育种过程更加科学和高效。最终,这种改进提高了育种率,提高了后代的质量,减少了遗传风险,加快了育种进程,实现了绵羊育种效果的全面提升,通过设定明确的对比阈值Y,能够直观地判断绵羊是否为优质种。这种方法通过简单的比较#imgabs0#值与阈值Y来实现优质种的分类,使得筛选过程更加清晰和易于操作,使用#imgabs1#与预设阈值Y的对比,能够快速筛选出优质种群和非优质种群。

    植入前胚胎的全基因组分型的方法及装置

    公开(公告)号:CN118841075A

    公开(公告)日:2024-10-25

    申请号:CN202411157426.8

    申请日:2024-08-22

    IPC分类号: G16B20/20 G16B30/10

    摘要: 本申请涉及植入前胚胎的全基因组分型的方法及装置,该方法包括如下步骤:基于双方亲本的基因组长片段测序的信息构建双方亲本的单体型的集合;基于胚胎基因组SNP信息和所述双方亲本的单体型的集合构建胚胎单体型的集合;基于所述双方亲本的单体型的集合扩充所述胚胎单体型的集合;对扩充后的胚胎单体型的集合进行数据质控和数据转换;以及,以人群基因组为参考对转换后的数据进行基因型插补,将所得的插补结果与亲本双链基因型结合,组建全基因组胚胎基因型。该方法提高胚胎未检测基因型的识别,实现胚胎基因组更大的检测覆盖。

    预测非小细胞肺癌的模型的构建方法及电子装置

    公开(公告)号:CN118841073A

    公开(公告)日:2024-10-25

    申请号:CN202410862815.4

    申请日:2024-06-28

    摘要: 本发明提供了一种预测非小细胞肺癌的模型的构建方法及电子装置。该构建方法包括:S1)获取训练集样本的测序数据BAM文件,其中,训练集样本包括对照样本和阳性样本;S2)根据训练集样本的测序数据BAM文件,获取并连接训练集样本中每个样本的拷贝数变异特征向量、突变方向特征向量和DNA片段长度特征向量,得到训练集样本的基础特征向量;基础特征向量包括对照样本的基础特征向量和阳性样本的基础特征向量;S3)将对照样本的基础特征向量和阳性样本的基础特征向量通过机器训练的方法,获得预测非小细胞肺癌的模型。能够解决现有技术中预测准确率低问题,适用于基因组学模型构建领域。