一种基于深度帧差卷积神经网络的运动目标检测方法

    公开(公告)号:CN111626090B

    公开(公告)日:2023-07-07

    申请号:CN202010137381.3

    申请日:2020-03-03

    Abstract: 本发明公开了一种基于深度帧差卷积神经网络的运动目标检测方法,属于计算机视觉领域,一种基于深度帧差卷积神经网络的运动目标检测方法,本发明的DifferenceNet具有孪生Encoder‑Decoder结构,通过输入两帧图像与对应的监督标签,可以学习两帧图像之间的时序信息与差异特征;AppearanceNet具有Encoder‑Decoder结构,通过主干提取t帧图像的表观信息,然后通过时‑空信息融合,对t+1帧图像中的运动目标进行预测;AppearanceNet还通过多尺度特征图融合和逐步上采样来保留多尺度空间信息,并且本方法在定性和定量方面均显着优于最新算法,并适用于存在动态背景,光照变化和阴影的复杂场景。

    一种基于注意力机制的图像分类方法

    公开(公告)号:CN113408577A

    公开(公告)日:2021-09-17

    申请号:CN202110517855.1

    申请日:2021-05-12

    Inventor: 徐智 宁文昌 李智

    Abstract: 本发明涉及图像数据处理领域,公开了一种基于注意力机制的图像分类方法,包括基于离散余弦变换对特征图每个通道进行频率分解并用多个频率分量联合表示通道全局信息,然后计算通道注意力权重信息;对特征图各通道基于权重信息加权得到通道注意力机制,然后计算特征图每个像素的空间注意力权重,再对特征图各空间像素加权求和,以得到空间注意力机制;将通道注意力机制和空间注意力机制嵌入到ResNet,得到图像分类卷积神经网络,并进行训练。本发明在通道注意力中将多个频率分量结合可以更好地表示通道的全局信息;在空间注意力中采用自注意力机制获取特征图空间维度上的全局信息,可以获得比传统卷积实现的空间注意力更优的空间权重分配。

    一种基于改进YOLOv8模型的复杂道路场景目标检测方法

    公开(公告)号:CN119762939A

    公开(公告)日:2025-04-04

    申请号:CN202411875591.7

    申请日:2024-12-19

    Abstract: 本发明提供了一种基于改进YOLOv8模型的复杂道路场景目标检测方法,涉及目标检测技术领域。该方法包括:对数据集图片进行预处理,按照比例将其划分为训练集、验证集和测试集;引入DualConv卷积构建D‑C2f模块;基于MLCA模块与DCNv4融合构建MD‑C2f模块;构建改进YOLOv8网络模型,包括Backbone特征提取模块、Head特征融合模块、检测头模块,其中,在Backbone特征提取模块中使用D‑C2f模块替代原有的C2f模块;在Head特征融合模块,将每个检测层中的C2f模块都替换成MD‑C2f模块,随后每个MD‑C2f模块后都添加一层SEAM注意力模块;将划分好的训练集作为构建的改进YOLOv8网络模型的输入,经过Backbone特征提取模块进行特征采集,提取不同尺度的特征图;将提取的特征图输入到Head特征融合模块不同尺度的检测层中,实现语义特征和定位特征的转移,得到融合特征;将融合特征输入检测头模块,最后输出图像中的检测框的位置和其目标类别。本发明提出了一种基于改进YOLOv8模型的复杂道路场景目标检测方法,提高了在复杂道路背景下的目标检测精度与速度,解决了对目标形状不规则、远处的目标检测精度低的问题。

    基于高效融合编码器与文本中心曲线预测的文字识别方法

    公开(公告)号:CN119723590A

    公开(公告)日:2025-03-28

    申请号:CN202411911785.8

    申请日:2024-12-24

    Inventor: 徐智 卢磊 林宇轩

    Abstract: 本发明涉及计算机视觉与人工智能领域,具体涉及一种基于高效融合编码器与文本中心曲线预测的文字识别方法。该方法通过特征提取模块获取图像特征,并利用高效融合编码器捕获高语义信息,同时减少低层次特征的冗余计算。结合特征建模模块,该方法能够准确预测文本实例的边界点和文本中心曲线,并通过并行预测机制同时完成文本实例分类、字符分类、中心曲线点预测和边界点预测。最终,结合解码模块处理字符分类结果,生成文本内容。实验结果表明,该方法在复杂场景中具有较高的识别精度、良好的实时性以及较强的鲁棒性,适用于多种文字检测与识别的应用场景。

    基于超像素和张量鲁棒主成分分析的高光谱图像分类方法

    公开(公告)号:CN119723206A

    公开(公告)日:2025-03-28

    申请号:CN202411911544.3

    申请日:2024-12-24

    Abstract: 本发明涉及高光谱图像分类技术领域,具体涉及一种基于超像素和张量鲁棒主成分分析的高光谱图像分类方法,方法步骤如下:1、选用超像素分割算法对高光谱图像进行超像素分割,获得不规则的超像素分割图;2、从原始高光谱图像获取与超像素分割图对应的不同超像素区域的包络立方体,定义为超张量;3、构建基于超张量的局部邻域保持图;4、设立目标函数,引入辅助变量,并基于交替方向乘子法迭代求解原高光谱图像的低秩项、辅助项和噪声项;5、划分训练集,利用多类支持向量机算法对所得的低秩项进行分类,得到最终的分类结果。本发明通过减轻高光谱图像分类任务中冗余信息和噪声的影响获得更高的地物分类精度。

    一种光时域发射仪事件检测方法及系统

    公开(公告)号:CN117478214A

    公开(公告)日:2024-01-30

    申请号:CN202311424785.0

    申请日:2023-10-31

    Abstract: 本发明公开了一种光时域发射仪事件检测方法及系统,方法包括以下步骤:S1:使用光时域反射仪测量光纤,获得光时域反射仪测试曲线;S2:对测试曲线数据进行去噪处理,获得去噪后的测试曲线数据;S3:进行离散小波变换和基于变换指数的恒虚警算法检测,获得小波系数反射事件点以及小波系数非反射事件点;S4:合并小波系数反射事件点和小波系数非反射事件点,并根据位置进行排序;S5:将完成位置排序的小波系数反射事件点和小波系数非反射事件点映射到测试曲线上,获得反射事件点和非反射事件点的真实位置,完成光时域反射仪事件检测。本发明能够快速、准确的定位目标,包括临近多目标、微弱的非反射事件也能准确检测出来。

    一种基于深度帧差卷积神经网络的运动目标检测方法

    公开(公告)号:CN111626090A

    公开(公告)日:2020-09-04

    申请号:CN202010137381.3

    申请日:2020-03-03

    Abstract: 本发明公开了一种基于深度帧差卷积神经网络的运动目标检测方法,属于计算机视觉领域,一种基于深度帧差卷积神经网络的运动目标检测方法,本发明的DifferenceNet具有孪生Encoder-Decoder结构,通过输入两帧图像与对应的监督标签,可以学习两帧图像之间的时序信息与差异特征;AppearanceNet具有Encoder-Decoder结构,通过主干提取t帧图像的表观信息,然后通过时-空信息融合,对t+1帧图像中的运动目标进行预测;AppearanceNet还通过多尺度特征图融合和逐步上采样来保留多尺度空间信息,并且本方法在定性和定量方面均显着优于最新算法,并适用于存在动态背景,光照变化和阴影的复杂场景。

    一种基于加权联合最近邻的多任务稀疏表示检测方法

    公开(公告)号:CN111079544A

    公开(公告)日:2020-04-28

    申请号:CN201911150556.8

    申请日:2019-11-21

    Abstract: 本发明公开了一种基于加权联合最近邻的多任务稀疏表示检测方法,属于图像处理技术领域,一种基于加权联合最近邻的多任务稀疏表示检测方法,包括以下步骤:利用多任务学习技术,构建多任务稀疏表示模型,将所有任务上累积的总重构误差应用于检测目标,得到多任务稀疏表示的检测结果,利用加权联合最近邻方法进行计算,得到加权最近邻的检测结果,将加权最近邻的检测结果和多任务稀疏表示的检测结果相结合,得到最终的检测函数,可以实现通过光谱信息和邻域空间信息同时进行检测,利用多任务学习,联合多个相关的子稀疏表示,得到较好目标检测效果,并且加入了加权联合最近邻算法,提高了对空间信息的利用,使目标检测效果得到了进一步提升。

Patent Agency Ranking