专利检索 ap:("浙江工商大学") AND inv:"钟钧健" 第 1 页

1.

发明公开
一种基于注意力机制的视频图像压缩方法审中-实审

公开(公告)号：CN118354101A

公开(公告)日：2024-07-16

申请号：CN202410448749.6

申请日：2024-04-15

申请人： 浙江工商大学

发明人： 郑赟 , 蒋旭 , 钟钧健 , 陈卫刚

IPC分类号： H04N19/57 , H04N19/43 , H04N19/91

摘要： 本申请公开了一种基于注意力机制的视频图像压缩方法，在DVC基础模型的残差数据编码器之后增加了一个基于Transformer的量化损失恢复模块，用于恢复残差潜在向量因量化操作而受损的部分，第一阶段的学习针对基础模型，获得若干组对应不同失真码率平衡因子值的网络参数集；在第二阶段学习中，对基础模型的每一组参数集学习若干组仅包括量化损失恢复模块的参数集；在第三阶段，对整个量化损失恢复模块和残差数据解码器进行学习。采用本发明提供的基于Transformer的量化损失恢复模块能够有效恢复受损的残差潜在向量，提高残差潜在向量在编码段和解码端的一致性，减少残差信息经压缩和解压后的失真，从而提高图像重建的质量。