一种基于半监督学习框架的T细胞受体序列分类方法

    公开(公告)号:CN111489792A

    公开(公告)日:2020-08-04

    申请号:CN202010291254.9

    申请日:2020-04-14

    Abstract: 本发明公开了一种基于半监督学习框架的T细胞受体序列分类方法,选取CDR3β区域作为输入数据,对T细胞受体数据进行特征编码;根据得到的数据,选择支持向量机、随机森林和决策树的监督学习算法分别构造初始分类器C1、C2、C3;对初始分类器C1、C2、C3进行训练得到扩充的新训练集,产生的训练集进行可重复取样获得三个有标记训练集,然后从每个新训练集产生一个分类器,对分类器进行迭代更新;训练完成后,将三个分类器C1、C2、C3通过投票机制作为一个分类器集成进行使用。本发明适用于T细胞受体序列数据难以获得的情况,性能显著优于现有方法。

    一种基于多连体特征的T细胞受体对应表位预测方法

    公开(公告)号:CN111429965B

    公开(公告)日:2023-04-07

    申请号:CN202010198109.6

    申请日:2020-03-19

    Abstract: 本发明公开了一种基于多连体特征的T细胞受体对应表位预测方法,将CDR3β链以及对应的表位解析为长度3的碱基,统计每种三联体的频次作为初始特征;根据得到的初始特征建立初始特征矩阵,使用主成分分析法对初始特征矩阵进行降维,进行特征提取;设有n个训练样本,输入预测数据x后,训练得到梯度提升决策树模型,通过梯度提升决策树模型将各个决策树的决策结果线性组合起来做出预测;将特征数据输入训练好的模型中进行预测,根据不同的预测目的选择不同的预测指标。本发明仅使用三联体的统计值作为初始特征,结合梯度提升决策树模型能够在极短的时间内完成模型的训练,且预测的准确度更高。

    一种基于DNA测序数据的同源重组缺陷判定方法

    公开(公告)号:CN111462823B

    公开(公告)日:2022-07-12

    申请号:CN202010270712.0

    申请日:2020-04-08

    Abstract: 本发明公开了一种基于DNA测序数据的同源重组缺陷判定方法,获取特征属性;提取有效数据;基于三重学习法框架,考虑到较好的泛化能力、较高的准确度和对多维特征属性的处理效率,选择三个不同的基分类器H1、H2、H3;对H1、H2、H3进行迭代训练得到扩充训练集,由此对模型进行更新,完成训练过程;使用所训练的模型对未标记样本集U进行标记,根据标记结果完成HRD状态的判定。本发明解决了使用单一或少量基因组不稳定性状态等局部特征来进行HRD状态判定的局限性,克服临床上已知HRD状态的样本数量极少的难点,实现已有样本数据下的多特征属性的学习,能够提高HRD判定方法的性能。

    一种基于多连体特征的T细胞受体对应表位预测方法

    公开(公告)号:CN111429965A

    公开(公告)日:2020-07-17

    申请号:CN202010198109.6

    申请日:2020-03-19

    Abstract: 本发明公开了一种基于多连体特征的T细胞受体对应表位预测方法,将CDR3β链以及对应的表位解析为长度3的碱基,统计每种三联体的频次作为初始特征;根据得到的初始特征建立初始特征矩阵,使用主成分分析法对初始特征矩阵进行降维,进行特征提取;设有n个训练样本,输入预测数据x后,训练得到梯度提升决策树模型,通过梯度提升决策树模型将各个决策树的决策结果线性组合起来做出预测;将特征数据输入训练好的模型中进行预测,根据不同的预测目的选择不同的预测指标。本发明仅使用三联体的统计值作为初始特征,结合梯度提升决策树模型能够在极短的时间内完成模型的训练,且预测的准确度更高。

    一种基于半监督学习框架的T细胞受体序列分类方法

    公开(公告)号:CN111489792B

    公开(公告)日:2022-12-09

    申请号:CN202010291254.9

    申请日:2020-04-14

    Abstract: 本发明公开了一种基于半监督学习框架的T细胞受体序列分类方法,选取CDR3β区域作为输入数据,对T细胞受体数据进行特征编码;根据得到的数据,选择支持向量机、随机森林和决策树的监督学习算法分别构造初始分类器C1、C2、C3;对初始分类器C1、C2、C3进行训练得到扩充的新训练集,产生的训练集进行可重复取样获得三个有标记训练集,然后从每个新训练集产生一个分类器,对分类器进行迭代更新;训练完成后,将三个分类器C1、C2、C3通过投票机制作为一个分类器集成进行使用。本发明适用于T细胞受体序列数据难以获得的情况,性能显著优于现有方法。

    一种基于DNA测序数据的同源重组缺陷判定方法

    公开(公告)号:CN111462823A

    公开(公告)日:2020-07-28

    申请号:CN202010270712.0

    申请日:2020-04-08

    Abstract: 本发明公开了一种基于DNA测序数据的同源重组缺陷判定方法,获取特征属性;提取有效数据;基于三重学习法框架,考虑到较好的泛化能力、较高的准确度和对多维特征属性的处理效率,选择三个不同的基分类器H1、H2、H3;对H1、H2、H3进行迭代训练得到扩充训练集,由此对模型进行更新,完成训练过程;使用所训练的模型对未标记样本集U进行标记,根据标记结果完成HRD状态的判定。本发明解决了使用单一或少量基因组不稳定性状态等局部特征来进行HRD状态判定的局限性,克服临床上已知HRD状态的样本数量极少的难点,实现已有样本数据下的多特征属性的学习,能够提高HRD判定方法的性能。

    基于自适应纹理和频域感知的人脸图像重建方法、系统、装置及介质

    公开(公告)号:CN116563167A

    公开(公告)日:2023-08-08

    申请号:CN202310612916.1

    申请日:2023-05-26

    Abstract: 本发明公开了一种基于自适应纹理和频域感知的人脸图像重建方法、系统、装置及介质,通过自适应纹理感知模块对粗糙特征进行自注意力计算,然后利用该注意力矩阵搜索精细特征中相关性强的部分,再进行精细的自注意力计算。并采用多维感知模块增强特征在跨空间和跨通道的表达能力。同时使用基于小波变换的多频融合模块,融合来自编码器的中低频特征和来自解码器的高频特征。自适应纹理感知模块使得模型可以更精细的恢复图像中的复杂区域,多维感知模块增强了特征中重要的通道信息,而多频融合模块消除了原始特征中的高频噪声,同时将中低频的有效特征与恢复的高频细节进行融合,从而提升了模型对人脸图像的恢复能力和泛化能力。

    杂合变异下校正第三代测序数据中测序错误的混合方法

    公开(公告)号:CN111583997B

    公开(公告)日:2022-03-01

    申请号:CN202010373513.2

    申请日:2020-05-06

    Abstract: 本发明公开了一种杂合变异下校正第三代测序数据中测序错误的混合方法,输入数据为第二代测序数据和第三代测序数据,利用已有的比对软件和组装软件对输入数据进行处理,基于贝叶斯分类器原理对基因位点的杂合性进行判断,结合杂合判断的结果对第三代测序数据中的读段进行校正,解决了现有校正算法在处理杂合变异时的低准确度和无效性的问题。本发明在校正测序错误时考虑了杂合变异,设计了一系列概率模型对杂合性进行判断和分类,再针对不同的杂合性分类采用不同的校正策略,解决了已有校正方法遇到杂合变异时出现校正错误的问题。

    一种大型合作网络的访问控制机制及其实现方法

    公开(公告)号:CN108600174B

    公开(公告)日:2020-07-28

    申请号:CN201810253615.3

    申请日:2018-03-26

    Abstract: 本发明公开了一种大型合作网络的访问控制系统及其实现方法,包括认证中心、网络服务器、数据拥有者、数据传播者和数据访问者,认证中心用于生成系统运行参数,提供注册、属性管理和分配密钥服务;网络服务器用于为用户提供数据服务;数据拥有者用于定义数据的访问权限和传播权限;当用户满足所述传播权限时,则以数据传播者的身份进行数据传输,数据访问者用于从所述网络服务器中获取并访问所述数据;所述数据采用两阶密文结构,由所述数据拥有者创建并由所述数据传播者补充。可以有效地阻止密钥混用的攻击;数据的解密工作迁移到网络服务器端来完成,以减少用户端的计算开销,保证了密文传播过程的安全性,满足了预期的用户需求。

Patent Agency Ranking