基于logistic与相关信息熵的特征基因选择方法

    公开(公告)号:CN104598774A

    公开(公告)日:2015-05-06

    申请号:CN201510057261.1

    申请日:2015-02-04

    IPC分类号: G06F19/22

    摘要: 本发明公开了一种基于logistic与相关信息熵新的特征基因选择方法,包括以下步骤:对数据集进行logistic回归,获得对分类影响较大的基因变量,利用Relief算法对基因变量赋值并排序,向初始特征基因集合添加最大特征值基因,计算相关信息熵。本发明将机器学习中的logistic回归模型引入特征基因选择方法中,获得高质量的基因表达谱;利用相关信息熵度量基因变量之间的相关性,剔除冗余基因,通过搜索特征基因空间集获取分类能力较强且基因数目较少的特征基因子集。

    一种带有缺失标记的不完备数据的多标记分类方法及装置

    公开(公告)号:CN113535947B

    公开(公告)日:2024-10-15

    申请号:CN202110558329.X

    申请日:2021-05-21

    摘要: 本发明涉及一种带有缺失标记的不完备数据的多标记分类方法及装置,属于数据分类技术领域。本发明首先基于邻域粗糙集理论,通过样本之间的差异性和相似性,构造了邻域可辨识和不可辨识矩阵,以此恢复不完备的信息,并得到所恢复信息的特征权重矩阵;然后基样本之间的模糊相似关系,结合模糊相似关系、回归模型以及特征权重矩阵建立考虑特征之间非线性关系的新的目标函数,并通过梯度下降方法对其进行优化求解,从而实现对带有缺失标记的不完备数据的多标记分类。本发明充分考虑了特征之间的非线性关系,大大提高了带有缺失标记的不完备数据的多标记分类的精度和效率。

    一种带有缺失标记的不完备数据的多标记分类方法及装置

    公开(公告)号:CN113535947A

    公开(公告)日:2021-10-22

    申请号:CN202110558329.X

    申请日:2021-05-21

    IPC分类号: G06F16/35 G06Q10/06

    摘要: 本发明涉及一种带有缺失标记的不完备数据的多标记分类方法及装置,属于数据分类技术领域。本发明首先基于邻域粗糙集理论,通过样本之间的差异性和相似性,构造了邻域可辨识和不可辨识矩阵,以此恢复不完备的信息,并得到所恢复信息的特征权重矩阵;然后基样本之间的模糊相似关系,结合模糊相似关系、回归模型以及特征权重矩阵建立考虑特征之间非线性关系的新的目标函数,并通过梯度下降方法对其进行优化求解,从而实现对带有缺失标记的不完备数据的多标记分类。本发明充分考虑了特征之间的非线性关系,大大提高了带有缺失标记的不完备数据的多标记分类的精度和效率。