-
公开(公告)号:CN118972589A
公开(公告)日:2024-11-15
申请号:CN202411026348.8
申请日:2024-07-30
Applicant: 杭州电子科技大学
IPC: H04N19/129 , H04N19/13 , H04N19/134 , H04N19/21 , H04N19/176 , H04N19/119
Abstract: 本发明公开了基于扫描线并行熵编码二值化优化的硬件流水实现方法,通过获取单帧图像的系数数据,基于多个通道的扫描区域,对系数数据分块,用于多通道间并行执行分块的遍历;构建扩展数组和二维数组用于分块内的系数遍历,扩展数组中,存储上一分块的参考编码系数信息及当前分块的编码系数信息,二维数组中,第一维数组存储当前分块各编码系数信息,第二维数组存储各当前分块编码系数信息对应的在前参考编码系数信息;分块遍历时,根据上一次循环结束后数组的结果,预处理当前分块每个编码系数及其对应的在前参考编码系数,第二维数组用于计算标志位;遍历多个通道的所有分块,计算当前编码系数的标志位的上下文索引增量,将结果顺序输出。
-
公开(公告)号:CN118158427A
公开(公告)日:2024-06-07
申请号:CN202410446677.1
申请日:2024-04-15
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/42 , H04N19/174 , H04N19/182
Abstract: 本发明属于视频编码领域,公开了一种面向AV1调色板编码模式的高效k‑means聚类硬件架构及方法,本发明提出三条k‑means电路并行的架构,k‑means电路包括calc_indices和calc_centroids两个模块。calc_indices模块根据像素和簇中心的距离,来计算像素的索引,其中距离采用曼哈顿距离,索引值为像素和簇中心距离最小的簇编号。calc_centroids模块执行簇中心的更新,将索引值相同的像素累加并求平均值,作为下一次迭代的簇中心存储在C‑RAM中,本发明将不同块、同一块的k的聚类计算过程进行交织,从而提高硬件的利用率并减少取数次数。
-
公开(公告)号:CN117319654A
公开(公告)日:2023-12-29
申请号:CN202311392255.2
申请日:2023-10-25
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/124 , H04N19/147 , H04N19/19 , H04N19/70
Abstract: 本发明属于视频编码领域,公开了一种基于扫描线并行RDOQ算法优化的硬件及流水实现方法,本发明在算法上将最优系数决策的之字形扫描线拆解成多个单向扫描线,以实现并行计算。在最优非零位置决策阶段,将迭代计算拆分成单条扫描线的并行计算,最后对各个扫描线上的最优位置进行RD cost的比较,在保证实时效果良好的前提下,减少迭代的周期,以满足视频编码处理的实时需求。本发明优化了传统的RD cost计算算法。Rate的强数据依赖使得运算须在单周期内完成,减少了硬件设计中运算的操作数量,节省了资源消耗。本发明充分利用Distortion无数据依赖的特性将运算拆分到多个流水线中,有效了提高硬件设计的时序表现。
-
公开(公告)号:CN110049338B
公开(公告)日:2023-04-18
申请号:CN201910344082.4
申请日:2019-04-26
Applicant: 杭州电子科技大学
IPC: H04N19/503 , H04N19/119 , H04N19/96 , H04N19/147 , H04N19/14 , H04N19/30 , H04N19/103
Abstract: 本发明公开了基于多层次分类的HEVC快速帧间编码方法。本发明包括运用CU层次的分类树、PU层次的分类树和TU层次的分类树实现HEVC快速帧间编码,其内容包括基于CU深度分类树的快速CU划分方法、基于帧间模式分类树的快速PU选择方法和基于TU深度分类树的TU划分方法。本发明利用了HEVC编码过程中CU深度、PU模式和TU深度在时空上的相似性,减少了CU划分的复杂度,简化了帧间预测模式的选择过程,同时利用TU的变换系数特征,降低了TU划分的复杂度。
-
公开(公告)号:CN115442620A
公开(公告)日:2022-12-06
申请号:CN202211095417.1
申请日:2022-09-06
Applicant: 杭州电子科技大学
IPC: H04N19/52 , H04N19/149 , H04N19/159 , H04N19/29 , H04N19/48
Abstract: 本发明属于视频编码领域,公开了一种AME低复杂度仿射运动估计方法,包括如下步骤:步骤1:基于划分深度的最优帧间模式的提前预测:根据父CU最优帧间模式来预测子CU最优帧间模式;步骤2:AME内部的低复杂度算法:在AME算法内部,通过CPMV平行与否、迭代过程的提前终止以及有无必要进行细粒度调整优化来加速AME算法;步骤3:AME外部的低复杂度算法:对于需要在传统Inter和AME之间进行模式决策的CU提取相关特征,基于决策树对这样的CU进行提前预测其最优帧间模式,以此跳过RDO决策及次优模式的遍历过程。本发明大大减少了VVC帧间模式决策复杂度。
-
公开(公告)号:CN115361557A
公开(公告)日:2022-11-18
申请号:CN202210992815.7
申请日:2022-08-18
Applicant: 杭州电子科技大学
IPC: H04N19/154 , H04N19/149 , H04N19/176 , H04N19/182 , H04N13/128 , H04N13/161
Abstract: 本发明方法公开了结合注意力机制的立体图像舒适度预测方法。本发明方法首先通过对输入的左、右视点图像分别进行半重叠采样,得到多个图像块对作为模型输入,分别得到低、中、高级特征的相加特征图和相减特征图;然后分别将低、中、高级特征的相加和相减特征图拼接成新的特征块,输入并行双注意力模块进行注意力加权;将低、中、高级特征的通道和空间注意力加权特征拼接成新的特征块,并分别输入对应的次要子网络,最终得到三个次要子网络的输出特征向量,合并三个次要子网络的输出特征向量,并输入用于回归预测的全连接层网络进行舒适度回归预测。本发明方法不仅降低了流程复杂度,还规避了因视差计算不准确带来的影响。
-
公开(公告)号:CN114445618A
公开(公告)日:2022-05-06
申请号:CN202111665038.7
申请日:2021-12-31
Applicant: 杭州电子科技大学
IPC: G06V10/25
Abstract: 本发明方法公开了一种跨模态交互RGB‑D图像显著区域检测方法。本发明方法首先分别从彩色图和深度图中利用VGG16网络提取RGB特征和深度特征;然后在RGB‑D交互模块中RGB特征和深度特征相互纠正,并增强边缘细节;深度权重分配模块中根据深度特征计算处理后的多个特征的融合权重;最后在注意力更新模块中细化融合后的特征。本发明方法将RGB与深度联系起来,通过补充丰富的边界信息来增强目标区域;在多尺度深度权重模块中计算权重,根据深度图的质量来决定其对显著区域的影响程度,消除了低质量深度图带来的负面影响,并提升算法的整体性能。本发明方法可以直接应用在3D图像处理,3D质量评估以及物体识别等工程领域中。
-
公开(公告)号:CN111405264B
公开(公告)日:2022-04-12
申请号:CN202010068774.3
申请日:2020-01-20
Applicant: 杭州电子科技大学
IPC: H04N13/122 , H04N13/128 , H04N13/15
Abstract: 本发明公开了一种基于深度调整的3D视频舒适度改善方法。解决了一般3D视频观看不舒适、视觉体验不佳的问题。本发明包括以下步骤:S1:对左视点图、右视点图的深度图都进行预处理,得到预处理图;S2:对预处理图进行深度滤波,得到滤波图;S3:对滤波图进行深度去纹理,得到去纹理图;S4:根据去纹理图进行虚拟视点绘制,获得虚拟右视点彩色图;S5:用虚拟右视点彩色图和原始视点图进行替换得到改善的3D视频。本发明的增益效果是降低了视差、梯度变化、纹理对观感体验的影响,实现了整体舒适度的改善。
-
公开(公告)号:CN108470178B
公开(公告)日:2021-09-07
申请号:CN201810121931.5
申请日:2018-02-07
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种结合深度可信度估计的深度图像显著性检测方法。相对于平面图像,立体图像中所包含的深度特征对于目标物体的显著性检测提供了更有效的信息。本发明包括深度可信度评价因子计算、预处理和深度显著性检测;深度可信度评价因子用来客观的描述深度图所包含目标区域深度信息的可信度;深度图可信度越好,提取目标物体的有用信息越多。此外,图像中距离人眼较近但非显著物体所在的区域对于显著性检测会造成一定影响;针对该情况提出一种预处理方式来降低地面等这类背景区域的干扰;最后,结合深度可信度评价因子进行基于深度紧凑性和对比度的显著性计算得到最终显著结果图。本发明获得的深度显著图质量较高,与视觉注意机制保持良好一致。
-
公开(公告)号:CN107133923B
公开(公告)日:2020-10-27
申请号:CN201710119309.6
申请日:2017-03-02
Applicant: 杭州电子科技大学
IPC: G06T5/00
Abstract: 本发明公开了一种基于自适应梯度稀疏模型的模糊图像非盲去模糊方法,其对一幅图像的梯度分布估计中并未采用一个固定的形状参数值和尺度参数值,而是针对不同的像素点采用不同的形状参数值和尺度参数值,使得本方法能够很好的适应图像纹理变化,从而使得利用本发明方法复原的复原图像具有较高的信噪比值,同时在主观质量上,复原图像的平滑区域没有噪声点而显得自然顺滑,复原图像的纹理区域更加清晰,获得了更佳的主观视觉质量;其将图像划分成平滑区域和纹理区域,对于属于平滑区域内的像素点直接采用固定的形状参数和尺度参数,而对于属于纹理区域内的像素点则采用全局收敛算法来估计形状参数和尺度参数,能够在较少数据下取得更好的估计结果。
-
-
-
-
-
-
-
-
-