-
公开(公告)号:CN117372461A
公开(公告)日:2024-01-09
申请号:CN202311312683.X
申请日:2023-10-11
Applicant: 杭州电子科技大学
IPC: G06T7/13 , G06T3/04 , G06T5/77 , G06T7/10 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/048 , G06N3/084
Abstract: 本发明公开了全局和局部多尺度动态虚拟视点空洞填充方法。本发明首先使用自适应动态模块生成最匹配的卷积核权重,提高了图像重建性能,加速了网络训练的收敛;然后引入了的全局和局部多尺度增强模块学习丰富的多尺度特征,将多尺度上下文信息注入到缺失区域并通过浅层特征与深层特征自适应加权融合,增强了局部特征到整体一致性的连接。在生成器中加入动态卷积模块,提高视觉任务中的性能,同时降低计算成本。本发明通过注意力机制允许网络更好地适应不同输入特征,尤其在处理复杂场景时表现出鲁棒性;使用多膨胀率的扩张卷积来捕获不同尺度特征,引入跨尺度特征融合以及局部和全局残差结构,提高对虚拟视点合成中的空洞区域进行精确填充的能力。
-
公开(公告)号:CN117097997A
公开(公告)日:2023-11-21
申请号:CN202311052724.6
申请日:2023-08-21
Applicant: 杭州电子科技大学
Inventor: 颜成钢 , 曾龙健 , 吴旭 , 金颖杰 , 江涛 , 孙垚棋 , 朱尊杰 , 高宇涵 , 王鸿奎 , 赵治栋 , 殷海兵 , 王帅 , 张继勇 , 李宗鹏 , 丁贵广 , 付莹 , 郭雨晨 , 赵思成
Abstract: 本发明公开了一种反向图像信号处理的噪声图像合成方法,首先构建噪声形成模型;然后估计噪声参数。记录两个原始图像序列即平场帧和偏置帧来估计由模拟和数字增益组成的整体系统增益K和噪声源;为了噪声形成模型能模拟多种ISO设置下的真实情况,对联合参数分布进行建模,以便以耦合的方式对噪声参数进行采样;最后完成噪声图像合成。本发明能够合成真实的噪声原始数据,更好地匹配噪声形成的潜在物理过程。本发明极大地提升了合成数据集地真实性;噪声参数校准方法可以校准多种相机的噪声参数,使合成数据集能模拟不同相机拍摄的真实图片,使通过该数据集训练的模型能具有很好的泛化性。
-
公开(公告)号:CN117058400A
公开(公告)日:2023-11-14
申请号:CN202311018632.6
申请日:2023-08-14
Applicant: 杭州电子科技大学
Inventor: 颜成钢 , 曾龙健 , 金颖杰 , 吴旭 , 江涛 , 王帅 , 张继勇 , 李宗鹏 , 丁贵广 , 付莹 , 郭雨晨 , 赵思成 , 孙垚棋 , 朱尊杰 , 高宇涵 , 王鸿奎 , 赵治栋 , 殷海兵
IPC: G06V10/40 , G06V10/82 , G06V10/30 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种微光RAW图像端到端训练的特征提取方法。首先构建包含具有基本像素对像素对应关系的图像对的大规模数据集;然后构建基于L2‑Net网络的深度学习框架(LowerFeat,确定损失函数;再通过构建的大规模数据集对LowerFeat进行训练;最后通过训练好的LowerFeat实现特征提取。本发明提出了LowerFeat框架,该框架以端到端的方式输出RAW格式图像的局部特征检测和描述,能可靠地提取足够的关键点,同时抑制具有不显著和噪声敏感特征的区域。
-
公开(公告)号:CN117041565A
公开(公告)日:2023-11-10
申请号:CN202310887654.X
申请日:2023-07-19
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/11 , H04N19/186 , H04N19/176 , H04N19/593
Abstract: 本发明公开了一种AV1视频帧内粗模式决策优化及硬件架构方法,基于AV1对帧内模式决策优化,粗模式决策减少了计算时间,而计算复杂度上,将原来的61种决策情况分为两次进行,第一次选择13种模式进行;第二次选择6种模式进行决策;此外,不对矩形块的预测代价值做哈达玛变换,而是选择用基于4x4方块SATD值的叠加;在预测代价排序的选择上,选用双调排序,以适合发明所设计的并行架构;系统级优化方面,在每个方块处理流程上,采用流水线设计,缩小了硬件所需的面积资源,也加快了硬件实现的速度。
-
公开(公告)号:CN116797785A
公开(公告)日:2023-09-22
申请号:CN202310327951.9
申请日:2023-03-30
Applicant: 杭州电子科技大学丽水研究院
IPC: G06V10/26 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明公开了一种基于特征提炼的伪装物体检测方法,首先获取伪装物体检测数据集,进行数据预处理;构建基于特征提炼的伪装物体检测模型;再通过训练集对构建好的基于特征提炼的伪装物体检测模型训练,对预测结果使用结构损失函数进行监督学习。最后对模型训练结果加以验证。本发明基于特征提炼的方式来构建伪装物体检测模型,对伪装物体图像的特征进行增强处理以及去除背景噪声,利用结构损失函数对结果进行监督学习,使得预测结果更加准确,具有较强的鲁棒性,从而实现对伪装物体的精确分割,对社会具有重要意义。
-
公开(公告)号:CN116614635A
公开(公告)日:2023-08-18
申请号:CN202310564729.0
申请日:2023-05-16
Applicant: 杭州电子科技大学
IPC: H04N19/42 , H04N19/142 , H04N19/70 , H04N7/18
Abstract: 本发明属于视频编码技术领域,公开了一种基于人机协同感知的室内监控视频编码方法,包括步骤1:搭建人机协同视频编码框架;步骤2:特定语义对象紧凑特征表示;步骤3:自适应背景更新;步骤4:残差编码资源分配。本发明针对室内监控视频特点提出自适应背景更新框架对背景进行动态更新,考虑了室内监控视频中特定前景语义对象能够被紧凑语义特征表示,通过特征提取网络为特定前景语义对象提取紧凑语义特征表示,本发明为传统编码器制定残差编码资源分配策略,避免无用编码资源分配的同时提升解码视频的人眼视觉质量,极大提高室内监控视频的压缩性能;实现高效特定语义信息检索和分析。
-
公开(公告)号:CN116597890A
公开(公告)日:2023-08-15
申请号:CN202310662530.1
申请日:2023-06-06
Applicant: 杭州电子科技大学
IPC: G16B5/00 , G06N3/048 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于自优化激活函数的生物信息时间序列预测方法,首先构建一个包含多种激活函数候选集;然后搭建自优化激活函数模块;将新的激活函数应用于循环神经网络中,用于实现非线性变换;最后通过改进后的循环神经网络对生物信息时间序列进行预测。本发明提出了一种新颖的自优化激活函数,使循环神经网络的每个激活函数能随着任务的不同自我优化改变自生结构,实现了循环神经网络设计和优化的更加灵活。与传统方法相比,本发明不仅提高了循环神经网络性能,还有效减少了选择激活函数所需的时间和成本。
-
公开(公告)号:CN112351279B
公开(公告)日:2023-07-28
申请号:CN202011152367.7
申请日:2020-10-26
Applicant: 杭州电子科技大学
IPC: H04N19/14 , H04N19/61 , H04N19/177 , H04N19/103
Abstract: 本发明公开了一种面向HEVC快速编码的自适应复杂度调整系统及方法。本发明首先结合离线训练模块和在线训练模块,确定在给定编码树单元(CTU)的目标编码时间时启用的预测模式以及跳过的模式;然后使用复杂度分配模块,利用第3个图片组(GOP)的编码时间来预测整个序列的编码时间,从而估算出当前给定目标复杂度下所需控制的序列目标编码时间,并将目标编码时间以分层的方式分配到CTU层级;在模式选择模块中,根据分配到每个CTU的目标编码时间选择启用的预测模式,然后开始编码,跳过未启用的模式;最后复杂度更新模块周期性地取一帧作标准编码,用于更新序列的目标编码时间和调整下一帧的目标编码时间。本发明充分利用视频编码的特点将实际的编码复杂度自适应地调整在目标复杂度附近,并尽可能减少失真。
-
公开(公告)号:CN116245968A
公开(公告)日:2023-06-09
申请号:CN202310210835.9
申请日:2023-03-07
Applicant: 杭州电子科技大学丽水研究院
Abstract: 本发明公开了基于Transformer的LDR图像生成HDR图像的方法,首先构建基于Transformer的HDR图像生成模型,包括浅层特征对齐模块、金字塔融合模块和图像重建模块;通过浅层特征对齐模块进行特征对齐,通过金字塔融合模块对对齐后的特征进行处理,获得不同尺度的特征,将金字塔融合模块处理后的不同尺度的特征融合成一个尺度;再将融合后的特征送入图像重建模块进行图像重建;最后将图像重建模块输出的结果使用卷积操作得到3层的HDR最终图片。本发明可以更好地学习非局部特征并自适应地减少虚拟阴影。本发明提出了一种新的金字塔融合模块,使图像可以与较低计算成本和根据全局信息。
-
公开(公告)号:CN115464657A
公开(公告)日:2022-12-13
申请号:CN202211201790.0
申请日:2022-09-29
Applicant: 杭州电子科技大学
IPC: B25J9/16
Abstract: 本发明公开了一种由电机驱动的旋转扫描装置的手眼标定方法,首先获取彩色、深度图像和电机位置编码数据;使用得到的彩色、深度图进行ICP位姿解算,将电机位置编码数据转换成电机的旋转角度;最后解算位姿关系方程得到手眼位姿变换。本发明对使用标定板进行手眼标定的传统方法进行了改进,进行相机定位时可以不依赖标定板灵活地在很多场景下进行相机的鲁棒定位,在简化标定计算过程的同时,避免了传统标定方法中多组相机‑标定板、手坐标系‑基坐标系位姿关系的误差累积。
-
-
-
-
-
-
-
-
-