基于CNN和累加隐层状态ConvLSTM的视频人体行为识别方法

    公开(公告)号:CN113971780B

    公开(公告)日:2024-06-18

    申请号:CN202111304214.4

    申请日:2021-11-04

    摘要: 本发明公开了一种基于CNN和累加隐层状态ConvLSTM的视频人体行为识别方法,其内容包括:使用在ImageNet上预训练的2D CNN作为骨干模型,并在CNN中数个固定的网络层位置之后插入AH‑ConvLSTM模块来构建整体网络;获取包含视频数据及标签的数据样本集并将其划分为训练样本集和测试样本集;使用片段采样的方式对视频进行采样,将采样得到的帧作为输入送到整体网络中;设置学习率对整体网络进行训练,训练数据使用训练样本集;使用分类器生成各类别识别分数,通过反向传播来更新整体网络参数,并将参数保存为权重文件;使用已验证准确率最高的权重文件初始化整体网络,对测试样本集视频帧进行片段采样,将采样得到的帧输入到整体网络中来学习视频中的时空信息,得到识别结果。

    一种基于循环生成对抗Transformer的脑肿瘤分割方法

    公开(公告)号:CN118115522A

    公开(公告)日:2024-05-31

    申请号:CN202410230171.7

    申请日:2024-02-29

    摘要: 本发明公开了一种基于循环生成对抗Transformer的脑肿瘤分割方法,包括:通过核磁共振成像方法获取脑肿瘤多模态MRI图像信息;将脑肿瘤多模态MRI图像进行预处理获得清晰脑肿瘤图像,构建基于循环生成对抗Transformer分割网络结构,所述对抗Transformer分割网络结构包括生成器和判别器;将输入数据集分为训练集和验证集,使用训练集对对抗Transformer分割网络结构进行训练并保存权重模型,将生成器生成出的图像作为脑肿瘤分割任务的结果,将验证集输入至完成训练的对抗Transformer分割网络结构进行验证,将验证集的分割结果传送至CBICA官方网站进行精确度验证获取脑肿瘤分割结果。

    一种二阶Transformer建模的视频行为识别方法

    公开(公告)号:CN115830491A

    公开(公告)日:2023-03-21

    申请号:CN202211436285.4

    申请日:2022-11-16

    摘要: 本发明公开了一种基于二阶Transformer建模的视频行为识别方法,包括:获取包含视频数据及标签的视频数据集,将视频数据集划分为训练集和测试集,并对视频数据集进行抽帧;将预训练的二阶Transformer架构作为骨干网络,该骨干网络使用二阶分类头进行数据分类;在该骨干网络中设计两种不同的时间建模方式,其一是在该网络中间的编码器内部插入标记移位模块和时空注意力模块,其二是在该网络的前端将3D时序卷积插入到标记嵌入模块中,从而构建出视频二阶Transformer网络;使用训练集训练视频二阶Transformer网络,训练过程包括网络特征的前向传播和误差的反向传播;训练模型时每次迭代更新网络参数,使用最优权重初始化视频二阶Transformer网络,在测试集上对该网络的性能进行评估。

    一种基于语言-视觉对比学习的多模态视频行为识别方法

    公开(公告)号:CN117197708A

    公开(公告)日:2023-12-08

    申请号:CN202310526292.1

    申请日:2023-05-10

    摘要: 本发明公开了一种基于语言视觉对比学习的多模态视频行为识别方法,包括:获取视频数据和其对应标签的语言描述,将语言视频数据集分为训练集和测试集,并对视频数据进行抽帧;使用对比语言图像预训练模型作为基础网络,对该基础网络进行拓展,从而构建基于语言视觉对比学习的视频多模态网络,该视频多模态网络根据视频特征和语言特征的相似度信息对视频进行分类;使用训练集中的语言和视频数据对视频多模态网络进行迭代训练从而更新该网络参数,该训练过程包括网络特征的前向传播和误差的反向传播;在每次迭代中更新网络参数,每次迭代中进行训练和验证,根据最优验证集精度保存视频多模态网络的最优权重,使用最优权重初始化视频多模态网络,在测试集上对该网络的性能进行评估。

    基于注意力机制与标准化密集空洞空间多尺度融合网络的人群计数方法

    公开(公告)号:CN114155210A

    公开(公告)日:2022-03-08

    申请号:CN202111358807.9

    申请日:2021-11-17

    摘要: 本发明公开了一种基于SDA‑SFANet的人群计数方法,内容包括:获取人群计数数据集,在训练过程中对数据进行预处理;建立多尺度感知的人群计数网络模型,在VGG网络中融入注意力机制模块;引入HDC标准化设计对ASPP模块优化改进,得到标准化的SDASPP模块,在VGG网络中加入SDASPP模块;利用所收集的数据集对所述模型进行训练;将VGG网络提取器和上下文感知模块和SDASPP模块输出的特征图通过级联和上采样的方式将图像还原到原始图像大小得到密度图;使用具有固定标准偏差内核的高斯方法生成groud truth D(x);密度图通过与高斯核卷积来构建;使用贝叶斯损失函数对预测的人群计数进行损失值计算,将损失值反馈到SDA‑SFANet;不断训练网络,对参数进行优化,直到获得对人群计数结果预测满意的模型为止。

    基于注意力机制与标准化密集空洞空间多尺度融合网络的人群计数方法

    公开(公告)号:CN114155210B

    公开(公告)日:2024-04-26

    申请号:CN202111358807.9

    申请日:2021-11-17

    摘要: 本发明公开了一种基于SDA‑SFANet的人群计数方法,内容包括:获取人群计数数据集,在训练过程中对数据进行预处理;建立多尺度感知的人群计数网络模型,在VGG网络中融入注意力机制模块;引入HDC标准化设计对ASPP模块优化改进,得到标准化的SDASPP模块,在VGG网络中加入SDASPP模块;利用所收集的数据集对所述模型进行训练;将VGG网络提取器和上下文感知模块和SDASPP模块输出的特征图通过级联和上采样的方式将图像还原到原始图像大小得到密度图;使用具有固定标准偏差内核的高斯方法生成groud truth D(x);密度图通过与高斯核卷积来构建;使用贝叶斯损失函数对预测的人群计数进行损失值计算,将损失值反馈到SDA‑SFANet;不断训练网络,对参数进行优化,直到获得对人群计数结果预测满意的模型为止。

    一种基于高阶建模的视频行为识别方法

    公开(公告)号:CN114863326B

    公开(公告)日:2024-04-05

    申请号:CN202210412688.9

    申请日:2022-04-19

    摘要: 本发明公开了一种基于高阶建模的视频行为识别方法,包括:在2D卷积神经网络的不同阶段插入相关性模块,对该网络末端进行迭代矩阵平方根归一化的协方差池化操作获得高阶相关性网络;获取视频数据集和标签,将视频数据集分为训练集和测试集;将所有的帧输入至高阶相关性网络中;采用训练集训练高阶相关性网络,在每次迭代中更新网络参数,每次迭代中对帧进行训练和验证,并根据最优验证集精度保存高阶相关性网络的最优权重;使用最优权重初始化高阶相关性网络,在测试集上对该网络的准确率进行评估,将测试集数据输入该网络中获得测试结果,将测试结果与标签数据进行对比,统计正确和错误的个数从而计算该网络在测试集上的准确率。

    一种用于视频行为识别的分组二阶时空特征聚合方法

    公开(公告)号:CN115439778A

    公开(公告)日:2022-12-06

    申请号:CN202210999885.5

    申请日:2022-08-19

    摘要: 本发明公开了一种用于视频行为识别的分组二阶时空特征聚合方法,包括:使用预训练的2D卷积神经网络作为骨干模型,获取包含视频数据及标签的数据集并划分为训练集和测试集,对视频进行抽帧并保存到本地;采用稀疏采样方式对视频进行采样,将采样得到的帧作为输入传送至整体分组二阶聚合网络中;使用训练集训练分组二阶聚合网络,在每次迭代中更新网络参数,并在每个迭代使用测试集数据进行验证,保存最优验证精度的分组二阶聚合网络权重;使用准确率最高的权重文件初始化分组二阶聚合网络,在测试集上进行测试,将测试结果与标签数据进行对比,统计正确和错误的个数从而计算该网络在测试集上的准确率。

    一种基于扩散模型和对抗学习的水下图像增强方法

    公开(公告)号:CN118736178A

    公开(公告)日:2024-10-01

    申请号:CN202410738392.5

    申请日:2024-06-07

    摘要: 本发明公开了一种基于扩散模型和对抗学习的水下图像增强方法,包括:获取配对图像作为训练数据,所述配对图像包括退化的水下图像以及对应增强后的参考图像;根据所述训练数据对基于扩散模型的生成器进行对抗训练,所述生成器用于对拼接退化图像进行增强处理,所述拼接退化图像由退化的水下图像和纯噪声图像通道级连接后获取;所述生成器采用基于U‑Net结构的扩散模型,将U‑Net结构中的原有的注意力模块替换为多尺度动态窗口注意力模块;获取待增强的水下图像输入训练后的生成器,获取生成器输出作为增强图像。本发明从水下图像特性出发,在深度学习方法中融入了跨尺度相似性和非均向性的捕捉机制,有助于提高水下图像增强的效果和适用性。