-
公开(公告)号:CN116229103A
公开(公告)日:2023-06-06
申请号:CN202310292680.8
申请日:2023-03-23
Applicant: 电子科技大学
IPC: G06V10/44 , G06V10/80 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明提供一种基于多尺度正负样本挑选的目标检测方法,主干网络输出的每一层的预测特征谱通过平均池化完成下采样再统一大小到与最高层特征谱相加得到中间特征;再使用注意力机制得到最终的中间特征谱;再利用最终的中间特征谱得到各层的融合加强特征谱;将各层的融合加强特征谱分别输入至目标检测头,将特征谱的尺度值大于等于尺度选择阈值的层的IoU最大的k个锚点框设置为正样本,其余预测的锚点框设置为负样本;将正样本和负样本一起输入至分类分支,将正样本输入至回归分支;分类分支用于输出目标的类别,回归分支用于输出目标所在矩形框的位置坐标;优化了现有目标检测任务的正负样本挑选策略。
-
公开(公告)号:CN116228933A
公开(公告)日:2023-06-06
申请号:CN202310295814.1
申请日:2023-03-23
Applicant: 电子科技大学
Abstract: 本发明提供一种基于域适应的漫画视频生成方法,包括以下步骤:先使用人脸视频数据集对运动驱动网络进行训练;完成预训练的运动驱动网络对于输入的一张给定的源影像和驱动帧,就能根据驱动帧的运动生成并输出给定源影像的目标视频;再使用人脸视频数据集与漫画数据集对跨域网络进行训练;引入域判别器,利用梯度翻转层混淆人脸视频数据集和漫画数据集实现域分类误差的最大化。本发明首先使用人脸视频数据集进行图像动态化任务的训练,再将其使用域适应的方法适应到漫画域,解决了漫画数据集数量少而直接使用其进行训练容易导致的过拟合,泛化能力差等问题,不需要进行逐视频优化,使得生成视频的质量和稳定性得以保证。
-
公开(公告)号:CN116246211A
公开(公告)日:2023-06-09
申请号:CN202310249523.9
申请日:2023-03-15
Applicant: 电子科技大学
IPC: G06V20/40 , G06V10/82 , G06V10/44 , G06V10/77 , G06V10/80 , G06F16/783 , G06N3/0464
Abstract: 本发明提供一种基于时空分组注意力机制的第一视角视频描述生成方法,对输入的第一视角视频提取第一视角视频的特征谱作为区域特征;位置编码模块输出区域特征对应的位置编码;再将区域特征加上其位置编码的结果来更新区域特征;空间分组注意力模块将区域特征高维度和宽维度合并为空间维度,再对空间维度上的全部特征计算两次分组注意力以充分建模所有特征之间在空间维度上的交互关系;之后,进行空间和时间维度的交换,时间分组注意力模块对时间维度上的全部特征计算两次分组注意力并输出,再在空间维度上求平均得到第一视角视频特征编码,为解码器提供有更多时空信息的视频特征,适应第一视角视频存在的抖动和帧间变化,从而提高描述语句的质量。
-
公开(公告)号:CN116245164A
公开(公告)日:2023-06-09
申请号:CN202310249525.8
申请日:2023-03-15
Applicant: 电子科技大学
IPC: G06N3/082 , G06N3/0464 , G06F17/18 , G06F18/23 , G06V10/82 , G06V10/774
Abstract: 本发明提供一种基于滤波器权重聚类的用于目标检测的CNN快速剪枝方法,包括目标检测模型初始化步骤;重要性评分的指数滑动平均处理步骤得到各个滤波器的重要性评分的滑动平均值;阈值计算步骤:计算卷积层的重要性评分,再将重要性评分最低的卷积层作为本次剪枝的目标卷积层;计算目标卷积层中计算其各个滤波器的重要性评分的方差,从而得到目标卷积层的重要性评分阈值;剪枝步骤:对目标卷积层的滤波器参数向量进行聚类;在目标卷积层的每个簇中,对重要性评分的滑动平均值最低且重要性评分的滑动平均值低于重要性评分阈值的滤波器进行剪枝。本发明在保证整体剪枝效果不降低的条件下,提升了用于目标检测的卷积神经网络滤波器剪枝的效率。
-
公开(公告)号:CN116250846A
公开(公告)日:2023-06-13
申请号:CN202310249522.4
申请日:2023-03-15
Applicant: 电子科技大学
IPC: A61B5/369 , G06F18/2415 , G06F18/25 , G06N3/0464 , G06N3/08 , G06F3/01 , A61B5/372 , A61B5/00
Abstract: 本发明提供一种基于数据转换的多分支运动想象脑电信号特征融合分类方法,旨在扩充网络结构宽度即网络分支的基础上,将脑电波数据转换为不同的输入格式,使用多个分支网络进行处理,使用格拉姆角场作为新的转换后的数据格式输入网络,和深度分离卷积及时频图相比提供了更加丰富的特征,有利于提高特征提取的完整性,使得不同网络分支之间具有的显著特征不同,提取的特征相互互补。转换为不同的数据格式有利于训练网络学习不同类型的特征。同时使用了分类任务中大任务和小任务以及其他任务的约束,即使用网络不同的任务目标实现多种约束,有利于网络提取到通适性更高、更全面的特征,取得了更佳的运动想象脑电信号分类效果。
-
-
-
-