基于两阶段密度聚类的红外图像识别方法

    公开(公告)号:CN108090514A

    公开(公告)日:2018-05-29

    申请号:CN201711443984.0

    申请日:2017-12-27

    IPC分类号: G06K9/62

    摘要: 本发明属于图像处理技术领域,具体为基于两阶段密度聚类的红外图像识别方法,包括两个阶段:使用Two-round-means算法将原始数据集聚成 块,并形成 个代表点。使用改进CFDP算法对 块进行聚类。最终每一块中所有节点获得与代表点相同的类标签。本发明提供的方法,算法的时间复杂度和空间复杂度大大降低,有效的提高了算法的效率,使其能有效的对大规模数据集进行聚类;无需任何参数设置,在实际使用中更加简洁,方便,对各种类型的数据集有更好的适应性。

    一种基于F-K域的被动源面波成像方法及数据筛选方法

    公开(公告)号:CN116299691B

    公开(公告)日:2023-10-27

    申请号:CN202211492715.4

    申请日:2022-11-25

    IPC分类号: G01V1/30 G01V1/36

    摘要: 本发明提供了一种基于F‑K域的被动源面波成像数据筛选方法,包括如下步骤:S1.对原始噪声数据进行预处理,并分割得到不同时间的噪声片段;S2.使用F‑K变换将噪声片段变换到频率波数域,对频率波数域的数据进行归一化,再拟合正负波数域的能量分布;S3.将能量分布与原始能量分布进行相关计算,得到不同时间片段的正负相关系数;S4.对不同时间片段的正负相关系数的大小进行降序排列,得到筛选后的正负因果叠加互相关函数;S5.通过正负因果叠加互相关函数,得到筛选后的数据。本发明可以自动检测具有高信噪比的噪声时间片段,无需人工干预,实现了数据快速自动化地筛选。

    基于特征转换和数据增强的微生物疾病诊断方法

    公开(公告)号:CN115910324A

    公开(公告)日:2023-04-04

    申请号:CN202211493068.9

    申请日:2022-11-25

    摘要: 本发明涉及微生物数据疾病诊断技术领域,涉及一种基于特征转换和数据增强的微生物疾病诊断方法,1)特征转换阶段:基于KPCA对原始的特征进行转换,转换后特征维度更低且与标签间的联系更强,能够得到更清晰、更有效的数据表示;2)代价敏感数据扩增:引入代价敏感学习,通过GAN对数据集中的正样本进行扩增,代价信息用于控制正负样本比例,构建代价敏感的数据集;3)集群分类器构建阶段:对构建的代价敏感数据集采用分而治之的策略,使用聚类算法将其划分成多个簇,每个簇建立各自的分类器,最终基于多个子分类器完成最终的疾病诊断任务。本发明能较佳地进行微生物疾病诊断。

    基于统计误差主动学习的井位优选方法

    公开(公告)号:CN110659685A

    公开(公告)日:2020-01-07

    申请号:CN201910897296.4

    申请日:2019-09-23

    摘要: 本发明公开了一种基于统计误差主动学习的井位优选方法,属于人工智能领域,本发明的有益效果:本发明根据理论分析和相关实验结果,说明了利用人工智能方法进行井位优选确实是有效的。本发明建立的实际误差模型证明了一直以来在聚类中默认的性质“距离越近的点,标签一致的可能性越大”的确是存在的。本发明合理使用聚类内部评价指标,将聚类后的数据集分为两类,并且针对其独有的特点选择不同的方案,使主动学习过程不完全依赖于聚类结果的好坏。本发明合理利用聚类后的分布建立的模型,为后续的主动学习样本选择和分裂过程提供理论依旧,并且在一定程度上提升了预测精度。

    基于序贯三支决策的代价敏感分类方法

    公开(公告)号:CN108921299A

    公开(公告)日:2018-11-30

    申请号:CN201810623608.8

    申请日:2018-06-15

    IPC分类号: G06N99/00

    摘要: 本发明公开了一种基于序贯三支决策的代价敏感分类方法,序贯三支决策体现了信息粒化和代价敏感学习的优势,其中信息粒化是人类认知和决策执行的基础,代价则是信息处理涉及的重要因素。提出针对代价敏感学习的序贯三支决策模型。首先,对信息粒化和决策代价之间的关系进行了定义和描述;然后,从序决策过程的视角,利用不同粒度层次的代价矩阵构建了代价函数;最后,为平衡决策结果代价和决策过程代价,提出了两个优化问题,并从理论上阐述了其意义,从实验结果分析上验证了算法的有效性,体现了序贯三支决策在代价敏感分类问题上的优势。

    基于被动源时移地震成像差异性分析的地下动态监测方法

    公开(公告)号:CN118226512A

    公开(公告)日:2024-06-21

    申请号:CN202410119219.7

    申请日:2024-01-29

    IPC分类号: G01V1/28 G01V1/30

    摘要: 本发明公开了基于被动源时移地震成像差异性分析的地下动态监测方法,属于油田开发技术领域,包括以下步骤:对原始噪声数据进行预处理;消除掉与地下储层无关的信号片段;对处理完后的信号片段进行基于地震干涉法的处理;对不同时间的成像剖面进行非目的层的数据匹配来凸显目的层的差异,根据成像数据走时差异和振幅差异初步实现储层差异的分析;对进行数据匹配后获得的不同时间的成像剖面,计算相关系数矩阵得到更为准确的成像差异区域,达到被动源时移监测的目的。通过上述方式,本发明提供了一种低成本、实时监测的策略,可通过采集长时间背景噪声实现连续监测目的,有较大的应用潜力,适用于油田开发任务中的地下监测。

    基于两阶段密度聚类的红外图像识别方法

    公开(公告)号:CN108090514B

    公开(公告)日:2021-06-15

    申请号:CN201711443984.0

    申请日:2017-12-27

    IPC分类号: G06K9/62

    摘要: 本发明属于图像处理技术领域,具体为基于两阶段密度聚类的红外图像识别方法,包括两个阶段:使用Two‑round‑means算法将原始数据集聚成块,并形成个代表点。使用改进CFDP算法对块进行聚类。最终每一块中所有节点获得与代表点相同的类标签。本发明提供的方法,算法的时间复杂度和空间复杂度大大降低,有效的提高了算法的效率,使其能有效的对大规模数据集进行聚类;无需任何参数设置,在实际使用中更加简洁,方便,对各种类型的数据集有更好的适应性。

    一种标签分布预测方法及装置

    公开(公告)号:CN110135507A

    公开(公告)日:2019-08-16

    申请号:CN201910423070.0

    申请日:2019-05-21

    IPC分类号: G06K9/62 G06F17/15 G06F17/16

    摘要: 本发明提供了一种标签分布预测方法及装置,该方法包括:S1:获取训练集合并初始化潜在因子矩阵;S2:根据训练集合和潜在因子矩阵构建基础目标函数;S3:根据潜在因子矩阵构建距离映射函数;S4:根据基础目标函数和距离映射函数构建目标函数;S5:目标函数对潜在因子矩阵求一阶偏导;S6:确定第一因子矩阵;S7:将第一因子矩阵代入一阶偏导向量获得一阶梯度矩阵;S8:判断一阶梯度矩阵的F范数是否小于临界阈值,如果是,执行S10,否则执行S9;S9:对潜在因子矩阵进行迭代优化获得新的第一因子矩阵,并执行S7;S10:根据第一因子矩阵获得待预测实例的标签分布向量。本方案能够提高对实例进行标签分布预测的准确性。

    一种评分分布预测方法及装置

    公开(公告)号:CN109872006A

    公开(公告)日:2019-06-11

    申请号:CN201910181625.5

    申请日:2019-03-11

    摘要: 本发明提供了一种评分分布预测方法及装置,该方法包括:构建包括有用于描述两评分潜在因子向量间相关性的符号函数和用于计算两评分潜在因子向量间距离的距离函数的目标函数;输入训练集数据,确定当前次迭代时的评分潜在因子矩阵并据此计算下一次迭代时的评分潜在因子矩阵,以得到新矩阵;将新矩阵代入目标函数,求解目标函数的一阶导数;一阶导数在新矩阵处的F范数的值小于预设终止阈值时,根据新矩阵获得待预测样本的评分分布预测结果,否则,将新矩阵再次作为当前次迭代时的评分潜在因子矩阵,如此循环。本方案通过在目标函数中引入符号函数和距离函数,考虑了评分标签之间的相关性,故基于此来预测评分分布时可提高预测准确度。

    基于峰值密度聚类的主动学习方法

    公开(公告)号:CN106991444A

    公开(公告)日:2017-07-28

    申请号:CN201710207476.6

    申请日:2017-03-31

    IPC分类号: G06K9/62

    摘要: 本发明涉及主动学习领域,尤其是基于峰值密度聚类的主动学习方法,其方法步骤为:(1)开始时,将所有未能标记数据进行聚类;(2)根据聚类的信息,构建一个选择器,从大量未标记样本中,选择最有价值的样本进行标记;(3)根据已经标记的样本和已有的聚类结构,对未能标记的样本进行预测和分类;(4)判断是否未分类实例,若是,则重新进行聚类,若否,则结束。本发明将ALEC方法与最主流的分类算法KNN,C4.5决策树算法,普通贝叶斯方法NaiveBayes方法在以下12个数据集上进行了仔细的比较,可以以很少的标记数量获得很高的准确度,可以大大减少人工标记实例的个数,从而大大减少成本,提高经济效益,同时具有很强的实用性。