-
公开(公告)号:CN119693725A
公开(公告)日:2025-03-25
申请号:CN202510210936.5
申请日:2025-02-25
Applicant: 华中农业大学
IPC: G06V10/764 , G06V10/26 , G06V10/25 , G06V10/22 , G06V10/75
Abstract: 本发明公开了一种基于背景语义生成和方位部件替换的图像扩增方法,包括:利用视觉语言模型收集原始图像数据集中每个原始样本的背景信息,并为每个原始样本添加方向标签;通过扩散模型生成保持原始样本的前景不变、背景受背景信息语义控制的多个新生样本;基于部件分割技术对原始样本和新生样本的前景进行部件分割,根据方向标签将新生样本中前景的部件替换为同类别的原始样本中前景的相应部件,得到扩增样本数据集。本发明在保持前景不变的前提下,实现了语义控制的背景生成,结合方向语义与部件级别分割技术,实现细粒度的目标部件替换,使图像混合后结构合理。本发明既能增强样本多样性,又能保持高类别保真度,可极大地提高模型的泛化能力。
-
公开(公告)号:CN119152312B
公开(公告)日:2025-02-28
申请号:CN202411597255.0
申请日:2024-11-11
Applicant: 华中农业大学
IPC: G06V10/774 , G06V10/26 , G06V10/28 , G06V10/764 , G06V20/70
Abstract: 本发明公开了一种基于可控背景混合的图像扩增方法及系统,该方法包括:基于视觉语言大模型获取原始图像数据集中每个图像的前景对象及背景信息的描述文本,得到多模态数据集;利用大语言模型根据多模态数据集对前景对象进行分类、对背景信息进行关键词提取,得到每个类别的前景对象对应的背景关键词;对每类前景对象的背景关键词进行均衡性分析,确定背景均衡方案;基于背景均衡方案生成扩增图像,将所述扩增图像添加到所述原始图像数据集中补充每类前景对象缺少的背景信息,得到背景均衡的扩展数据集。本发明能够充分利用背景的上下文信息,通过处理图像背景完成数据扩增,实现数据集的标签零污染,帮助提高模型的泛化能力。
-
公开(公告)号:CN113689438A
公开(公告)日:2021-11-23
申请号:CN202110925139.7
申请日:2021-08-12
Applicant: 华中农业大学
Abstract: 本发明公开了一种针对果粒边缘的葡萄果粒分割方法,涉及图像分割领域。本方法是:①采集实验室人工背景葡萄图像和自然场景葡萄图像,采集图像完成后,对图像进行数据增强和数据标注:②建立基于深度学习的葡萄果粒分割模型,将取得的标注数据输入深度学习模型进行训练;③输出葡萄果粒边缘区域分割结果。本发明具有下列优点和积极效果:①针对果粒边缘的自定义标注方法,实现了将葡萄果粒分割这一实例分割问题转化为语义分割问题;②具有解决复杂场景下重叠遮挡问题的能力和较好的泛化性;③不仅解决了葡萄重叠果粒的分割问题,也为解决其它计算机视觉领域分割问题提供了思路。
-
公开(公告)号:CN105203543A
公开(公告)日:2015-12-30
申请号:CN201510607956.2
申请日:2015-09-22
Applicant: 华中农业大学
IPC: G01N21/84
Abstract: 本发明公开了一种基于机器视觉的整箱红提葡萄果粒大小自动分级装置及其方法,涉及群体水果分级技术领域。本方法是:①对待测的整箱红提葡萄进行编号并放置传送带上;②依次把整箱红提葡萄送入密封箱中进行图像采集,同时得到近红外图像和彩色图像;③对近红外图像和彩色图像进行图像处理:读取图像;对图像进行预处理;图像融合;边缘提取;葡萄果粒图像分割;去除小面积处理;椭圆拟合;提取参数;对椭圆进行筛选;建立分级模型并检验。本发明利用机器视觉技术,能够完成整箱红提葡萄的自动分级;分级标准统一,分级正确率高;利用图像处理技术实现了无损检测,且检测速度快;用机器视觉技术对群体性物体实现大小无损检测,具有广阔的应用前景。
-
公开(公告)号:CN118262180B
公开(公告)日:2025-01-03
申请号:CN202410549161.X
申请日:2024-05-06
Applicant: 华中农业大学
IPC: G06V10/764 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0895 , G06V10/30 , G06T7/194
Abstract: 本发明涉及一种基于前景背景多级划分与特征融合的细粒度图像分类方法,该方法利用主干网络得到检测图像中不同区域的重要程度分布,并通过设定阈值对图像进行分割,得到前景图像和多级背景图像;对分割后的图像进行预处理并输入主干网络,得到前景特征和多个背景特征;基于每一个背景特征和前景特征之间的相似度,以及每一个背景特征的原图像与前景图像的距离得到两组权重,对前景特征和每一个背景特征进行两次加权,将加权后的所有特征进行融合并送入分类器得到分类结果。本发明采用前景‑背景多级划分和特征加权融合,使分类模型能够更加准确地捕获图像中强判别区域的同时,提取了图像背景中的有效信息并去除噪音,有效提高了分类准确性。
-
公开(公告)号:CN118262180A
公开(公告)日:2024-06-28
申请号:CN202410549161.X
申请日:2024-05-06
Applicant: 华中农业大学
IPC: G06V10/764 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0895 , G06V10/30 , G06T7/194
Abstract: 本发明涉及一种基于前景背景多级划分与特征融合的细粒度图像分类方法,该方法利用主干网络得到检测图像中不同区域的重要程度分布,并通过设定阈值对图像进行分割,得到前景图像和多级背景图像;对分割后的图像进行预处理并输入主干网络,得到前景特征和多个背景特征;基于每一个背景特征和前景特征之间的相似度,以及每一个背景特征的原图像与前景图像的距离得到两组权重,对前景特征和每一个背景特征进行两次加权,将加权后的所有特征进行融合并送入分类器得到分类结果。本发明采用前景‑背景多级划分和特征加权融合,使分类模型能够更加准确地捕获图像中强判别区域的同时,提取了图像背景中的有效信息并去除噪音,有效提高了分类准确性。
-
公开(公告)号:CN110826552A
公开(公告)日:2020-02-21
申请号:CN201911071966.3
申请日:2019-11-05
Applicant: 华中农业大学
Abstract: 本发明公开了一种基于深度学习的葡萄无损自动检测装置及其方法,涉及水果品质检测领域。本方法是①将待检测葡萄悬挂在电控旋转挂钩上,并进行编号;②启动相机采集软件;③启动电控轨道,对当前悬挂葡萄进行拍摄;④按照编号依次摘取每面4-5颗葡萄,首先用游标卡尺对葡萄大小进行测量,其次用糖度检测仪器测量每颗葡萄糖度并记录实验数据;⑤采集图像完成后,对图像进行预处理和数据标注:⑥建立基于深度学习的回归模型;⑦通过深度学习模型算法,检测出葡萄的类别、糖度、尺寸、颜色和重量信息。本发明预测能力更强;保证水果样本的完整性,实现无损检测;提高工作效率,实时输出检测结果。
-
公开(公告)号:CN102680414B
公开(公告)日:2014-06-25
申请号:CN201210171976.6
申请日:2012-05-30
Applicant: 华中农业大学
Abstract: 本发明公开了一种基于机器视觉的红提葡萄自动分级装置及其方法,涉及水果分级技术领域。本装置的结构是:密闭箱和灯箱上下连接成一个整体,在两箱之间的隔板上设置有一个圆孔;在两箱的侧壁上设置有平板电脑;在灯箱的上部中间内置有环形日光灯,在密闭箱的下部中间内置有工业相机,工业相机的摄像头正对圆孔;工业相机通过数据线和平板电脑相连;红提葡萄置于灯箱中。本发明采用机器视觉技术,能够完成自动分级;标准统一,分级准确;利用计算机处理图像,效率高;能实现无损检测分级;用机器代替人眼,能够适应现代化自动检测行业,具有良好的应用推广前景。
-
公开(公告)号:CN102680414A
公开(公告)日:2012-09-19
申请号:CN201210171976.6
申请日:2012-05-30
Applicant: 华中农业大学
Abstract: 本发明公开了一种基于机器视觉的红提葡萄自动分级装置及其方法,涉及水果分级技术领域。本装置的结构是:密闭箱和灯箱上下连接成一个整体,在两箱之间的隔板上设置有一个圆孔;在两箱的侧壁上设置有平板电脑;在灯箱的上部中间内置有环形日光灯,在密闭箱的下部中间内置有工业相机,工业相机的摄像头正对圆孔;工业相机通过数据线和平板电脑相连;红提葡萄置于灯箱中。本发明采用机器视觉技术,能够完成自动分级;标准统一,分级准确;利用计算机处理图像,效率高;能实现无损检测分级;用机器代替人眼,能够适应现代化自动检测行业,具有良好的应用推广前景。
-
公开(公告)号:CN119152312A
公开(公告)日:2024-12-17
申请号:CN202411597255.0
申请日:2024-11-11
Applicant: 华中农业大学
IPC: G06V10/774 , G06V10/26 , G06V10/28 , G06V10/764 , G06V20/70
Abstract: 本发明公开了一种基于可控背景混合的图像扩增方法及系统,该方法包括:基于视觉语言大模型获取原始图像数据集中每个图像的前景对象及背景信息的描述文本,得到多模态数据集;利用大语言模型根据多模态数据集对前景对象进行分类、对背景信息进行关键词提取,得到每个类别的前景对象对应的背景关键词;对每类前景对象的背景关键词进行均衡性分析,确定背景均衡方案;基于背景均衡方案生成扩增图像,将所述扩增图像添加到所述原始图像数据集中补充每类前景对象缺少的背景信息,得到背景均衡的扩展数据集。本发明能够充分利用背景的上下文信息,通过处理图像背景完成数据扩增,实现数据集的标签零污染,帮助提高模型的泛化能力。
-
-
-
-
-
-
-
-
-