-
公开(公告)号:CN114359558B
公开(公告)日:2024-11-12
申请号:CN202111525707.0
申请日:2021-12-14
Applicant: 重庆大学
IPC: G06V10/26 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于混合框架的屋顶图像分割方法,包括:构建训练所需的屋顶样本数据集;构建包括学习模块和推理模块的混合模型;将所述屋顶样本数据集的数据输入所述学习模块;利用所述学习模块中构造的深度卷积神经网络对图像样本进行学习,提取图像中屋顶的初始轮廓;利用所述推理模块对所述学习模块提取的初始轮廓进行调整,反向传播更新所述学习模块的参数;通过多次迭代完成混合模型训练,利用所述混合模型完成对需处理屋顶图像的分割。本发明基于混合框架对屋顶图像进行分割,通过构建学习模块和推理模块更好地保留屋顶轮廓信息,并保证在边界模糊情况下能得到准确的边界拓扑结构。
-
公开(公告)号:CN118586282A
公开(公告)日:2024-09-03
申请号:CN202410729427.9
申请日:2024-06-06
Applicant: 重庆大学
Abstract: 本发明公开了面向稀疏连续控制任务的奖励塑造方法、装置、介质及终端,包括采集智能体与仿真环境交互产生的经验数据,包括智能体执行的动作,仿真环境的当前状态信息和下一个状态信息,以及仿真外部奖励信号;利用全连接神经网络构建势能函数网络模型,获取智能体在当前状态和下一个状态的仿真环境的势能值;根据势能值差,通过奖励塑造函数计算内在奖励信号并和仿真外部奖励信号合并,得到最终的奖励信号;利用损失函数对势能函数网络模型进行更新,调整智能体执行动作的策略,使智能体在与环境的交互中获得最大化累积奖励;本发明利用状态之间的新旧策略的优势值差异作为内在奖励,提高了稀疏连续控制任务中的智能体性能,降低了计算成本。
-
公开(公告)号:CN115760914B
公开(公告)日:2024-09-03
申请号:CN202211406680.8
申请日:2022-11-10
Applicant: 重庆大学
Abstract: 本发明公开了一种基于自适应模态权重和跨模态学习的相关滤波跟踪方法,包括:利用加权的方式将提取的可见光图像特征和红外图像特征融合,得到融合模态特征;将融合模态特征、热红外模态特征和可见光模态特征作为输入,构造具有相关滤波器的目标函数;利用ADMM算法求解目标函数最优解,获得相关滤波器参数,并对目标搜索区域中目标进行定位,得到各模态目标位置响应图;寻找目标位置响应图中最大值点的位置,得到目标跟踪结果;根据目标跟踪结果对相关滤波器参数进行更新,并继续后续跟踪。本发明充分发挥多模态的互补优势,有效克服背景杂波和部分遮挡等问题,提升跟踪效果。
-
公开(公告)号:CN116132756B
公开(公告)日:2024-05-03
申请号:CN202310020696.3
申请日:2023-01-06
Applicant: 重庆大学
IPC: H04N21/81 , G06F16/783 , G06N3/08 , G06N3/0499 , H04N21/84 , H04N21/845
Abstract: 本发明公开了一种基于深度学习的端到端视频字幕生成方法,采用视觉编码器和文本编码器分别提取视觉网格特征和全局文本特征;将视觉网格特征送入局部视觉编码器得到精细的局部视觉特征;将局部视觉编码器中产生的中间特征输入到桥梁模块产生全局视觉特征;将全局视觉特征与全局文本特征一起输入到注意力机制的多模态编码器进行融合,产生多模态特征;将多模态特征输入到解码器中的预融合模块与已经生成的单词进行初步融合,生成预融合特征;将局部视觉特征输入到解码器中的交叉注意力模块与预融合特征相结合,逐字生成描述。该方法能够并行产生局部视觉特征和多模态表征,减少训练时间的同时提高建模能力,从而生成更准确的字幕描述。
-
公开(公告)号:CN116189292A
公开(公告)日:2023-05-30
申请号:CN202310014498.6
申请日:2023-01-05
Applicant: 重庆大学
IPC: G06V40/20 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于双流网络的视频动作识别方法,属于涉及视频图像处理技术领域。包括从待识别视频数据集中抽取若干图像帧,利用TVL1算法从图像帧中提取光流数据;利用残差网络从图像帧中提取时空特征,同时利用残差网络从光流数据中提取运动特征;采用基于注意力机制将时空特征和运动特征进行残差融合,获取注意力融合特征;根据注意力融合特征、时空特征和运动特征计算门控权重,并将注意力融合特征进行全局特征提取获取共享特征;将共享特征进行加权后分别与时空特征和运动特征进行融合,得到新的时空特征和运动特征,从而完成视频数据集动作识别。本发明改善了传统双流方法中RGB和光流的特征提取,实现了信息的有效融合与共享。
-
公开(公告)号:CN110211140B
公开(公告)日:2023-04-07
申请号:CN201910513878.8
申请日:2019-06-14
Applicant: 重庆大学
Abstract: 本发明公开了一种基于3D残差U‑Net和加权损失函数的腹部血管分割方法,包括以下步骤:S1,输入CT序列图像;S2,对CT序列图像进行预处理,并截取图像的最大连通区域;S4,将截取了最大连通区域后的每套CT图像序列打包成NIFTI格式的数据;S5,将已标注的NIFTI格式的图像输入到3D残差U‑Net网络中,使用加权的Dice损失函数计算输出图像与真实图像的误差,更新3D残差U‑Net网络中的参数,获得已训练的3D残差U‑Net网络;S6,将待测的NIFTI格式的图像输入到已训练的3D残差U‑Net网络中,输出预测图像;S7,将3D残差U‑Net网络中输出的预测图像扩大到原始图像尺寸,并进行平滑去噪处理。
-
公开(公告)号:CN113269765B
公开(公告)日:2022-10-28
申请号:CN202110624559.1
申请日:2021-06-04
Applicant: 重庆大学
Abstract: 本发明提出了一种可扩张卷积神经网络训练方法及CT影像分割模型构建方法。该可扩张卷积神经网络训练方法为:对原始图像进行下采样获得不同尺度的训练样本,将所述训练样本按尺寸从小到大先后于可扩张卷积神经网络中进行卷积计算并训练可扩张卷积核参数;每种尺寸的训练样本训练完成后,扩张可扩张卷积核,并继承前次训练得到的结果对可扩张卷积核进行精细训练。采用这种大尺寸数据训练过程依赖小尺寸数据训练结果的训练方式,构成多步骤训练的级联关系,能够显著的加快网络模型的训练速度,不需要额外准备预训练数据,训练过程适用于各种不同维度的网络模型,且能够在不使用预训练模型的前提下提升网络模型的分割精度。
-
公开(公告)号:CN114584536A
公开(公告)日:2022-06-03
申请号:CN202210162434.6
申请日:2022-02-22
Applicant: 重庆大学
IPC: H04L65/60 , H04N19/147 , H04N19/149 , H04N19/567
Abstract: 本发明公开了一种基于分区率失真建模的360度流媒体传输方法,步骤包括,获取视频段,并将所述视频段分割成多个视频分片;将所述多个视频分片输入至预先构建的率失真模型中,并计算所述多个视频分片的估计失真;根据所述多个视频切片的估计失真,计算出最优码率分配策略,并根据所述最优码率分配方案对所述多个视频分片进行视频码率分配;计算码率分配后的视频分片的真实失真;根据所述估计失真和所述真实失真对所述率失真模型进行参数更新;本发明使用率失真模型来调整传输段中每个分片的码率,提高传输性能,还提出了一种率失真模型参数更新策略,以进一步减少传输错误。
-
公开(公告)号:CN114359558A
公开(公告)日:2022-04-15
申请号:CN202111525707.0
申请日:2021-12-14
Applicant: 重庆大学
Abstract: 本发明公开了一种基于混合框架的屋顶图像分割方法,包括:构建训练所需的屋顶样本数据集;构建包括学习模块和推理模块的混合模型;将所述屋顶样本数据集的数据输入所述学习模块;利用所述学习模块中构造的深度卷积神经网络对图像样本进行学习,提取图像中屋顶的初始轮廓;利用所述推理模块对所述学习模块提取的初始轮廓进行调整,反向传播更新所述学习模块的参数;通过多次迭代完成混合模型训练,利用所述混合模型完成对需处理屋顶图像的分割。本发明基于混合框架对屋顶图像进行分割,通过构建学习模块和推理模块更好地保留屋顶轮廓信息,并保证在边界模糊情况下能得到准确的边界拓扑结构。
-
公开(公告)号:CN110443246B
公开(公告)日:2022-02-22
申请号:CN201910747553.6
申请日:2019-08-14
Applicant: 重庆大学
IPC: G06V10/25
Abstract: 本发明公开一种基于均值差优化的鱼眼图像有效区域提取方法,通过建立椭圆模型来表示鱼眼图像有效区域,并通过将鱼眼图像有效区域内部的均值最大化且外部的均值最小化来优化椭圆,且计算外部均值减去内部均值的最小值,从而找到全局最优值,再输出对应的椭圆参数,提取鱼眼图像有效区域图像。本发明对鱼眼图像有效区域的边缘模糊、有效区域外噪声点以及有效区域内图像内容变化都有很好的鲁棒性,提高了鱼眼图像合成的精度。
-
-
-
-
-
-
-
-
-