一种图像目标识别方法
    1.
    发明授权

    公开(公告)号:CN118397420B

    公开(公告)日:2024-09-06

    申请号:CN202410864924.X

    申请日:2024-07-01

    Abstract: 本发明涉及计算机视觉技术领域,尤其涉及一种图像目标识别方法,包括:获取待识别图像并输入到预先训练好的能够持续学习的图像目标识别模型中,图像目标识别模型对待识别图像中的目标进行识别,输出图像目标识别结果;图像目标识别模型包括多个能够新增目标感知模块的多分支感知模块,每个多分支感知模块均包括多个同类型的目标感知模块,且每个多分支感知模块对应的多个目标感知模块均通过正反馈循环的方式对待识别图像中的目标进行感知,以及每个多分支感知模块中新增的同类型的目标感知模块是利用对应的多分支感知模块中其他的目标感知模块均判别错误的训练样本进行训练后得到的,从而能够解决现有技术中存在着的“灾难性遗忘”问题。

    一种用于判别咳嗽音的多分支模型系统的持续学习方法

    公开(公告)号:CN118430575A

    公开(公告)日:2024-08-02

    申请号:CN202410889363.9

    申请日:2024-07-04

    Abstract: 本发明涉及语音识别与人工智能技术领域,尤其涉及一种用于判别咳嗽音的多分支模型系统的持续学习方法,包括:对待判别音频数据进行频谱分析,生成待判别音频数据的梅尔倒谱图;将梅尔倒谱图输入到能够扩展分支的多分支模型系统中,以得到最终的用于表示待判别音频数据是否为咳嗽音的二分类结果;其中,多分支模型系统包括n个并联的分支,并且n个并联的分支中每个分支均包括咳嗽音感知模型,其中,第n个分支中的咳嗽音感知模型是利用前n‑1个分支中的咳嗽音感知模型均判别错误的训练样本数据进行训练后得到的,从而能够解决现有技术中存在着的“遗忘”的问题。

    视觉感知饱和策略的图像自适应缩小方法

    公开(公告)号:CN109544452B

    公开(公告)日:2023-06-23

    申请号:CN201811358212.1

    申请日:2018-11-15

    Abstract: 本发明公开了一种视觉感知饱和策略的图像自适应缩小方法,包括以下步骤:1)利用不同缩小倍数Ki,通过原图像下采样,构造出多个缩小图Ii;2)分别对Ii用显著点预测算法计算显著图Si,其中显著度值大于平均值的像素点作为注视点;3)对Ii中注视点做Mean‑聚类,生成多个聚类Class_j;4)每类注视点形成自身注视区域和类中心,则该类点到类中心的归一化类内距离可作为微跳视幅度参数看待;5)对Ii中各类的归一化类内距离做累计平均,作为该图的微跳视幅度Ai;6)比较微跳视幅度Ai,其最小值对应的Ki是最佳图像尺度。

    一种桥接多源域自适应的跨域组织病理学图像识别方法

    公开(公告)号:CN116188428A

    公开(公告)日:2023-05-30

    申请号:CN202310167733.3

    申请日:2023-02-27

    Abstract: 本发明公开了一种桥接多源域自适应的跨域组织病理学图像识别方法,包括如下步骤:步骤S1:收集整理来自三种不同癌症领域的组织病理学图像数据集,构建训练集和测试集;步骤S2:对训练样本和测试样本图像进行数据增强处理,得到多个源域批处理图像与目标域批处理图像,将两种批处理图像进行桥接混合,产生多个中间域批处理图像;步骤S3:构建一种新的多源域自适应框架,包括多源域桥接自适应网络,域对抗自适应模块,并改进损失;步骤S4:采用步骤S2获得的多个源域批处理图像、中间域批处理图像和目标域批处理图像对步骤S3的多源域自适应框架训练并得到权重文件;步骤S5:测试集经过已训练好的分类模型进行精度测试,并输出测试结果。

    一种背景抑制与视觉感知正反馈的白细胞检测方法

    公开(公告)号:CN107169959B

    公开(公告)日:2022-01-21

    申请号:CN201710331855.6

    申请日:2017-05-08

    Inventor: 潘晨 吴祯

    Abstract: 本发明公开了一种背景抑制与视觉感知正反馈的白细胞检测方法,可以提取显微图像中染色的有核细胞。首先,原图像被直接、粗略划分为注视区和非注视区;通过对这两个区域像素的多次随机采样,来模拟人眼微跳视对注视区的重复扫描。采样后的多个样本集,经学习构建出多个PELM模型;多模型对全体像素的分类结果叠加构成粗显著图。接着,粗显著图借助RBD算法抑制背景,并针对注视区构建基于PELM的正反馈迭代过程;若迭代中PELM分类结果稳定,则视觉感知饱和,结束循环。最终的PELM分类结果即为检测得到的白细胞目标区域。算法无需先验知识与人工事先标记图像,可实现自动化白细胞检测提取。

    视觉感知饱和策略的超像素参数自适应选择方法

    公开(公告)号:CN108596832A

    公开(公告)日:2018-09-28

    申请号:CN201810346540.3

    申请日:2018-04-18

    Abstract: 本发明公开了一种视觉感知饱和策略的超像素参数自适应选择方法,包括以下步骤:1)利用SLIC(简单线性迭代聚类)算法,采用不同超像素参数Ki,由原图像构造出多个超像素图SPi;2)将超像素表示为单个像素,则每个超像素图可表示为原图的一个缩小图像Ii;3)分别对Ii用显著点预测算法计算显著图Si,其中显著度值大于平均值的像素点作为注视点;4)用注视点做Kmeans聚类,生成多个聚类Class_j;5)每类注视点形成各自注视区域及质心,则该类注视点到质心的类内距离可作为微跳视幅度参数看待。6)对整个图像中各类的类内距离做归一化并累计,作为该尺度图像的微跳视幅度AOMi;7)比较AOMi,其最小值对应的超像素参数Ki就是最佳参数。

    基于视觉感知正反馈的显著性检测方法

    公开(公告)号:CN106780468A

    公开(公告)日:2017-05-31

    申请号:CN201611202475.4

    申请日:2016-12-22

    Inventor: 潘晨 吴祯

    Abstract: 本发明公开了一种基于视觉感知正反馈的显著性检测方法,包括:1)利用已有的多种显著性检测方法初步检测图像显著度;2)叠加上述结果,生成新的综合显著度图。阈值法二值化该图,形成二值注视区Ip;3)重复采集Ip内外的少量像素样本,经训练,并行构建多个RVFL神经网络模型;多个神经网络模型分类像素,经集成形成二值目标输出BW;4)BW作为一种神经发放脉冲,返回步骤2与综合显著图做叠加,形成迭代循环;5)迭代中,若正反馈环节的输入Ip与输出BW基本相同,表明感知饱和,迭代停止。Ip或BW即为图像中的最显著目标分割结果。本发明通过多种显著性检测方法叠加和视觉感知正反馈迭代,来模拟人类视觉,得到更接近人类视觉感知的视觉显著图。

    视觉感知饱和策略的超像素参数自适应选择方法

    公开(公告)号:CN108596832B

    公开(公告)日:2022-07-05

    申请号:CN201810346540.3

    申请日:2018-04-18

    Abstract: 本发明公开了一种视觉感知饱和策略的超像素参数自适应选择方法,包括以下步骤:1)利用SLIC(简单线性迭代聚类)算法,采用不同超像素参数Ki,由原图像构造出多个超像素图SPi;2)将超像素表示为单个像素,则每个超像素图可表示为原图的一个缩小图像Ii;3)分别对Ii用显著点预测算法计算显著图Si,其中显著度值大于平均值的像素点作为注视点;4)用注视点做Kmeans聚类,生成多个聚类Class_j;5)每类注视点形成各自注视区域及质心,则该类注视点到质心的类内距离可作为微跳视幅度参数看待。6)对整个图像中各类的类内距离做归一化并累计,作为该尺度图像的微跳视幅度AOMi;7)比较AOMi,其最小值对应的超像素参数Ki就是最佳参数。

    利用感知饱和融合直觉与记忆的图像目标检测方法

    公开(公告)号:CN114255369A

    公开(公告)日:2022-03-29

    申请号:CN202111560412.7

    申请日:2021-12-20

    Abstract: 本发明公开了一种利用感知饱和融合直觉与记忆的图像目标检测方法,包括以下各个步骤:(1)先构造两个并行视觉感知通道的目标检测系统,分别由无监督与有监督的目标检测算法构成;通过比较两通道系统输出的目标检测初始结果,能够获得图像中每个像素的感知饱和度描述;(2)随机选择图像中目标和非目标区域的高饱和度像素构建训练样本集,在线训练一个像素分类模型,利用该模型对图像中欠饱和的像素分类处理,最终高饱和度像素区域可形成更优化的目标检测结果。

    机器学习、背景抑制与感知正反馈相结合的视觉显著性检测方法

    公开(公告)号:CN107169958B

    公开(公告)日:2022-01-25

    申请号:CN201710331853.7

    申请日:2017-05-08

    Inventor: 潘晨 吴祯

    Abstract: 本发明公开了一种机器学习、背景抑制与感知正反馈相结合的视觉显著性检测方法。算法模拟人眼微跳视与感知衰退机制,提出一种算法框架。首先,图像被直接、粗略划分为注视区和非注视区;通过对这两个区域像素的多次随机采样,来模拟微跳视对注视区的重复扫描。采样后的多个样本集,经学习构建出多个PELM模型;多模型的分类结果叠加构成粗显著图。接着,粗显著图通过RBD算法抑制背景,并针对注视区构建基于PELM的正反馈迭代过程;若迭代中PELM分类结果稳定,则视觉感知饱和,结束循环。PELM分类结果可被看作一种视觉刺激,叠加刺激形成目标被强化的新显著图,可实现了一种完全数据驱动、逐步求精的显著性检测。

Patent Agency Ranking