-
公开(公告)号:CN110309792B
公开(公告)日:2022-07-01
申请号:CN201910599633.1
申请日:2019-07-04
Applicant: 电子科技大学
Abstract: 本发明公开了基于部件模板的室内人物检测方法,属于目标检测领域和深度学习领域,首先收集数据集,再对数据集进行特征提取和构建特征金字塔,基于部件模板的子区域得到每个候选框的前景置信分数,并通过池化和全连接层得到定位框位置,完成检测模型的搭建;然后根据数据集的图片采用Xavier方法对检测模型进行初始化,基于检测模型的损失函数进行迭代到预设迭代次数,完成检测模型的训练,最后使用新的图片进行推理测试,得到检测结果。本发明解决了目前通用的目标检测方法在对室内场景的人物检测方面定位和识别的准确率较低的问题。
-
公开(公告)号:CN110675405B
公开(公告)日:2022-06-03
申请号:CN201910867163.2
申请日:2019-09-12
Applicant: 电子科技大学
IPC: G06T7/11 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于注意力机制的one‑shot图像分割方法。在单个特征和简单的双分支融合不足以使查询分支从支持分支中提取有用信息的情况下。本发明为了支持分支关注于两个分支共性的区域,以便准确地引导查询分支分割图像,将多级上下文特征和注意模块引入到one‑shot图像分割中找到更准确有效的指导方法。本发明能更好地利用现有的知识迅速对新类图像进行分割,利用多级指导和注意力机制来强化学习两个分支的共性,进而准确地指导未知图像的分割。
-
公开(公告)号:CN110648332B
公开(公告)日:2022-03-15
申请号:CN201910866119.X
申请日:2019-09-12
Applicant: 电子科技大学
Abstract: 本发明提供的一种基于多分支卷积神经网络特征正交的图像可判别区域提取方法,包括步骤:1)构建N个结构相同卷积神经网络作为多分支卷积神经网络的N个分支,N个卷积神经网络相互不共享参数;任意两个不同分支输出的特征之间作哈达玛积,将哈达玛积的矩阵中所有元素相加得到两两分支的特征正交损失;多分支卷积神经网络的总损失函数为所有分支的分类损失加上超参数乘两两分支的特征正交损失之和;2)得到训练集;3)训练多分支卷积神经网络;4)利用经过训练的多分支卷积神经网络进行图像可判别区域提取。本发明使用了多分支卷积神经网络,利用特征正交,使不同分支的卷积神经网络之间彼此不同,从而可以获得不同的可判别区域信息。
-
公开(公告)号:CN113379655A
公开(公告)日:2021-09-10
申请号:CN202110537516.X
申请日:2021-05-18
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于动态自注意力生成对抗网络的图像合成方法,属于计算机视觉领域。该方法首先选择生成对抗网络作为基本框架,并对训练图片进行归一化,还对正态分布进行采样得到噪声样本。本发明借鉴了Linformer算法和动态卷积算法,并对发明中使用的多头自注意力机制进行改进,增加了每个自注意力头之间的联系和约束,使得这些自注意力头可以去学习到图像的各种模式知识。本发明充分地发挥了动态自注意力机制和生成对抗网络的优势,提出的动态自注意力模块可大幅度降低多头自注意力机制的计算复杂度,并改善生成对抗网络的模式崩塌和训练不稳定等问题。
-
公开(公告)号:CN112926662A
公开(公告)日:2021-06-08
申请号:CN202110222614.4
申请日:2021-02-25
Applicant: 电子科技大学
Abstract: 本发明提供一种基于多尺度语言嵌入REC的目标检测方法,把语言特征转化为不同尺度的卷积核,并与视觉特征进行卷积,得到语言特征与视觉特征每个点及其周围的点的相似度,将得到的相似度谱作用回原始视觉特征上,加强与语言相关的视觉特征的表达,同时引入全局视觉语言相互作用信息及位置信息,预测被描述的目标的位置,提升了网络对于视觉上下文的利用能力,相比于基准的普通基于单阶段REC的目标检测方法,预测准确率更高。
-
公开(公告)号:CN109308719A
公开(公告)日:2019-02-05
申请号:CN201811011545.7
申请日:2018-08-31
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于三维卷积的双目视差估计方法。包括下列步骤:利用双目标定方法标定双目摄像头,得到双目矫正映射图;对待估计的双目图像进行矫正,得到矫正后的双目图像;将矫正后的双目图像送入预设的二维卷积神经网络,得到经过特征变换后的特征图;将当前帧的特征图和之前多帧图像的特征图进行拼接,送入三维卷积神经网络,得到多帧图像的特征图。将多帧图像的特征图进行转置卷积,重新变换回像素域,得到视差估计图。本发明相较于现有的基于卷积神经网络的双目视差估计方法,通过三维卷积提取时间维度上的信息,结合当前帧与之前多帧的双目信息来估计当前帧的双目视差图。相较于原有方法,本方法在准确度、前后帧间的连贯性上有改进。
-
公开(公告)号:CN109308458A
公开(公告)日:2019-02-05
申请号:CN201811010695.6
申请日:2018-08-31
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于特征谱尺度变换提升小目标检测精度的方法,属于目标检测技术领域。本发明在传统目标检测算法SSD的基础上,通过对特征谱通道、宽和高的重组操作,将深层特征谱的宽和高放大一倍,然后将得到的新的特征谱与浅层特征谱进行级联组合得到新的特征谱,在此基础上预测目标的位置和类别。本发明不用通过额外的计算,将特征谱用重组的方式进行尺度变换放大,实现小目标检测效果的提升。相比传统的SSD检测方法,该方案能够更有效地提升小目标检测的精度,同时对于较大目标也能保持很好的精度效果。
-
公开(公告)号:CN109255320A
公开(公告)日:2019-01-22
申请号:CN201811018713.5
申请日:2018-09-03
Applicant: 电子科技大学
IPC: G06K9/00
CPC classification number: G06K9/00973 , G06K2209/21
Abstract: 本发明公开了一种改进的非极大值抑制方法。本发明通过多次迭代筛选的方式进行抑制处理:对待处理的矩形框按照置信度从高到低排序,保留当前置信度最高的矩形框,然后依次遍历余下矩形框的与已保留的所有矩形框的重叠面积的总和占全图面积的比例是否大于阈值,若是,则将其删除;然后未删除和未保留的矩形框作为新的一轮待处理的矩形框继续进行上述抑制处理,直到待处理的矩形框只存在一个。本发明通过上述方式,解决了传统非极大值抑制方法对于不规则目标输出矩形框数量较少、重叠率较高、矩形框对目标的拟合度较低的技术问题。
-
公开(公告)号:CN109242864A
公开(公告)日:2019-01-18
申请号:CN201811087399.6
申请日:2018-09-18
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于多分支网络的图像分割结果质量评价方法。属于图像处理技术领域。本发明为了取得评价效果更好的图像分割结果质量评价方案,采用基于多分支卷积神经网络的评价网络对分割结果进行评价得出其质量预测分数,为后续的分割性能优化和最佳分割结果挑选提供依据。与现有的对不同图像分割结果进行评的评价方式相比,本发明利用多分支的卷积神经网络,从多方面提取分割图像更全面的特征,从而解决了现有评价方式在关联性较小分割结果差距较大,以及在较为相似的分割结果评价处理时效果不佳的技术问题。
-
公开(公告)号:CN108428234A
公开(公告)日:2018-08-21
申请号:CN201711000091.9
申请日:2017-10-24
Applicant: 电子科技大学
Abstract: 本发明公开了一种基于图像分割结果评价的交互式分割性能优化方法,旨在解决现有技术中交互式分割方法的分割参数人工选择耗时耗力,同时交互分割参数固定而导致交互式分割结果准确率不高的问题;本发明提出了一种新的基于分割质量评价的自动选择交互式分割方法参数以获取最优分割的方法,利用分割质量评价来获得最优的分割参数从而提高了分割的准确性,其中分割质量评价采用基于卷积神经网络的方法,保证了评价的高准确率,构建了一个新的交互式分割性能优化结构;本发明适用于图像处理领域相关领域。
-
-
-
-
-
-
-
-
-