-
公开(公告)号:CN113763391B
公开(公告)日:2024-03-19
申请号:CN202111125764.X
申请日:2021-09-24
申请人: 华中科技大学
IPC分类号: G06T7/10 , G06V10/80 , G06N3/0464 , G06N3/0455
摘要: 本发明公开了一种基于视觉元素关系的智能化图像剪裁方法和系统,属于数字图像处理与模式识别技术领域。包括:利用深度卷积网络提取框内和框外的视觉单词内容特征以表达各视觉元素,结合可学习的位置嵌入表达,将输入图像转化为具有图像空间位置信息的框内和框外视觉单词序列;利用多层多头注意力模块,建模框内单词之间的引性美学关系和框内与框外单词之间的斥性美学关系,得到引性和斥性美学关系特征;融合内容特征、引性美学关系特征和斥性美学关系特征,预测每一个候选裁剪框的美学评分并排序,得到裁剪结果。本发明挖掘了视觉元素之间的关系模式,可更泛化、更鲁棒地应用于各种类别的图像,且通过裁剪得到的重构图结果更加符合真实用户偏好。
-
公开(公告)号:CN113763524A
公开(公告)日:2021-12-07
申请号:CN202111101270.8
申请日:2021-09-18
申请人: 华中科技大学
摘要: 本发明公开了一种基于物理光学模型和神经网络的双流散景渲染方法及系统,属于计算机视觉技术领域,方法包括:将全聚焦图像转换为RAW格式,并利用视差图、模糊程度参数及聚焦视差参数,得到带符号的散焦图;物理渲染器根据光圈形状参数,对图像中的深度平滑区域进行多风格渲染;神经网络渲染器渲染图像中的深度不连续区域,并预测该区域的概率图;融合物理渲染器和神经网络渲染器的结果;将融合后的散景图像从RAW格式还原为初始格式。本发明不仅能够渲染接近单反相机的散景效果,同时能够自由调整聚焦平面、模糊程度及渲染风格,真实性高、可定制性强。
-
公开(公告)号:CN112037294A
公开(公告)日:2020-12-04
申请号:CN202010800336.1
申请日:2020-08-11
申请人: 华中科技大学
摘要: 本发明公开了一种可解释的植物计数方法和系统,属于农业自动观测领域。方法包括:对植物原始图依次进行编码、解码,并将解码得到的特征映射与软掩膜融合实现特征分割;将编码阶段中设定分辨率的特征映射与分割得到的特征映射进行点乘;对点乘得到的特征映射进行卷积得到局部计数,并对局部计数的权重进行动态分配,得到冗余计数图;对冗余计数图进行归一化和可视化处理,得到可解释的植物计数图。本发明方法没有粗糙地将计数结果直接平均分配到局部区域内,而是通过重新分配局部区域的特征权重,提高了局部计数图的输出分辨率,增强了输出计数图的可解释性。
-
公开(公告)号:CN104573701B
公开(公告)日:2017-12-12
申请号:CN201410722382.9
申请日:2014-12-02
申请人: 华中科技大学
摘要: 本发明公开了一种玉米雄穗性状的自动检测方法,该方法首先对所采集的田间玉米下视图像进行目标性检测,生成雄穗候选框以获得雄穗潜在区域,随后通过多视角图像特征以及费舍尔向量编码方法对雄穗进行特征描述以及目标检测,从而对雄穗所属区域进行确认,同时在检测结果的基础上利用语义分割进一步完成雄穗精细形态的分割,最后建立了图像特征与长度性状、宽度性状、周长性状、直径性状、穗色性状、分枝数性状以及总穗数性状七种具有物理意义的生物量之间的映射关系。本发明方法能实时地对玉米雄穗的生长状态进行连续监测,检测结果准确率高,对玉米的生殖生长研究、玉米基因学与遗传学研究以及产量估计都具有重要的意义。
-
公开(公告)号:CN115830055A
公开(公告)日:2023-03-21
申请号:CN202211643195.2
申请日:2022-12-20
申请人: 华中科技大学
摘要: 本发明公开了一种深度图像抠图中训练样本的生成方法,属于图像处理技术领域,包括:利用合理前景结合操作符将待结合的两张源前景进行结合;根据两张源前景结合是否产生孪生前景时将两张源前景和结合前景绑定为三元组,或将两张源前景、结合前景和孪生前景绑定为四元组,将三元组和四元组加入待合成前景集;重复上述步骤直至对应的目标待合成前景集中前景数量满足预设条件;为目标待合成前景集中的每个前景分配背景集中的一张随机背景,进行前景背景合成从而得到训练样本。本发明能够解决以往方法中前景结合操作符产生伪影的问题,并关注源前景和结合前景之间的关系,增加样本集中的相关性,提高网络对于前景模式的学习能力。
-
公开(公告)号:CN115760590A
公开(公告)日:2023-03-07
申请号:CN202211248653.2
申请日:2022-10-12
申请人: 华中科技大学
摘要: 本发明公开了一种视频稳像方法及系统,属于计算机视觉领域,基于光流预测网络获得帧间光流场以及对应的置信度图,并利用置信度图反向传播寻找多帧共同的共享区域掩膜,从而得到多帧共享的背景区域;通过将视频稳像问题转化为不动点的优化问题,构建相机位姿回归网络,使其利用帧间共享背景区域的光流场,通过迭代得到最优的相机轨迹参数,平滑后对视频进行稳像;本发明通过端到端的相机位姿回归网络直接回归相邻帧之间的位姿变换参数,相比于传统的方法需要通特征检测、特征匹配、计算变换矩阵以及分解参数的复杂步骤,能够在保证视觉质量的前提下,以较快的运行速度实现视频稳像。
-
公开(公告)号:CN116863254A
公开(公告)日:2023-10-10
申请号:CN202310740750.1
申请日:2023-06-21
申请人: 华中科技大学
IPC分类号: G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于梯度先验的鲁棒双边稠密特征上采样方法及应用,属于图像处理技术领域。包括:从稠密预测网络中提取需要上采样的图像特征,得到输入特征图;对输入特征图进行均值处理,得到均值特征图;对均值特征图做梯度映射,得到梯度先验特征,将每一个对应点的梯度先验整理为上采样梯度核;将上采样过程中原像素和上采样后像素相对距离做距离映射,生成距离先验特征,将每一个对应点的距离先验特征整理为上采样距离核;将距离核和梯度核相结合,生成上采样核;最后将输入特征上采样核之间进行卷积操作,得到对应输入特征图的上采样后的特征图。本发明能够克服以往算子需要高分辨率特征引导的局限性,使其能够具有多任务鲁棒性。
-
公开(公告)号:CN113436224B
公开(公告)日:2022-04-26
申请号:CN202110655020.2
申请日:2021-06-11
申请人: 华中科技大学
摘要: 本发明公开了一种基于显式构图规则建模的智能图像裁剪方法及装置,属于图像美学与多媒体技术领域,方法包括:i)利用深度卷积网络作为骨架网络对输入图像进行特征提取;ii)对于构图分支,基于类别激活映射技术生成每类构图规则的置信度以及相应的类别激活图,并将其融合为关键要素图;iii)对于裁剪分支,对骨架网络的特征图进一步编码,在原图中预设均匀的锚点,裁剪网络输出这些锚点与标注裁剪框的偏移量;利用关键要素图对每个预设的锚点进行加权,得到预测裁剪框;iv)利用损失函数对整个网络进行优化。本发明关注了裁剪结果的构图可解释性,提高了裁剪结果的构图质量,具有很高的处理速度,实时性强。
-
公开(公告)号:CN113763524B
公开(公告)日:2024-08-09
申请号:CN202111101270.8
申请日:2021-09-18
申请人: 华中科技大学
IPC分类号: G06T15/00 , G06T5/50 , G06N3/0464 , G06N3/048
摘要: 本发明公开了一种基于物理光学模型和神经网络的双流散景渲染方法及系统,属于计算机视觉技术领域,方法包括:将全聚焦图像转换为RAW格式,并利用视差图、模糊程度参数及聚焦视差参数,得到带符号的散焦图;物理渲染器根据光圈形状参数,对图像中的深度平滑区域进行多风格渲染;神经网络渲染器渲染图像中的深度不连续区域,并预测该区域的概率图;融合物理渲染器和神经网络渲染器的结果;将融合后的散景图像从RAW格式还原为初始格式。本发明不仅能够渲染接近单反相机的散景效果,同时能够自由调整聚焦平面、模糊程度及渲染风格,真实性高、可定制性强。
-
公开(公告)号:CN117152455A
公开(公告)日:2023-12-01
申请号:CN202311088025.7
申请日:2023-08-28
申请人: 华中科技大学
IPC分类号: G06V10/44 , G06T3/40 , G06V10/82 , G06N3/0464
摘要: 本发明公开了一种特征图上采样方法及应用,属于图像处理技术领域,包括:S1、将输入特征图映射为位置偏置图;其中,位置偏置图第i行第j列的元素(Δxi,Δyj)表示输入特征图([i/s],[j/s])位置处的位置偏置;s为缩放比例;H和W分别为输入特征图的长和宽;S2、将位置偏置图中第i行第j列的元素(Δxi,Δyj)与位置([i/s],[j/s])相加,得到输入特征图的采样位置图;S3、基于采样位置图,对输入特征图进行插值,得到高分辨率特征图,从而实现对输入特征图的上采样操作。本发明在保证上采样性能的基础上,能够以较低的复杂度和较快的计算速度实现上采样。
-
-
-
-
-
-
-
-
-