一种结合空时域上下采样的HEVC视频质量增强框架

    公开(公告)号:CN118678080A

    公开(公告)日:2024-09-20

    申请号:CN202310247533.9

    申请日:2023-03-15

    申请人: 四川大学

    摘要: 本发明提出了一种结合空时域上下采样的HEVC视频质量增强框架,所提框架编码前,构建空、时域分辨率下转换模块,将输入的原始视频序列的分辨率和帧率下降为原先的一半;经由基于HEVC标准的HM16.9编码器进行编码,得到码流信息;解码后依靠提出的空域分辨率上转换模块CSVR和空时域分辨率上转换模块STRIB恢复原始的分辨率和帧率,并使用MV信息提升网络性能。实验结果表明,所提算法框架能够显著地提升压缩视频质量。本发明可广泛应用于数字电影拍摄传输、文体活动直播、远程教育培训和目标检测等领域。

    一种基于通道注意力和交叉注意力的文本生成图像方法

    公开(公告)号:CN117853341A

    公开(公告)日:2024-04-09

    申请号:CN202211199178.4

    申请日:2022-09-29

    申请人: 四川大学

    摘要: 本发明公开了一种基于通道注意力和交叉注意力的文本生成图像方法。包括以下步骤:文本描述通过交叉注意力编码器得到单词特征矩阵和交叉注意力特征向量,交叉注意力编码器是一个需要训练的网络,该网络能够提取出原图像信息和文本信息,该网络对提取出的图像特征和文本特征通过通道注意力,通道注意力的作用是对每一个特征通道进行加权,突出重要信息,然后将其输入交叉注意力,交叉注意力将两种跨模态信息进行翻译和对齐,最终输出交叉注意力特征向量。交叉注意力特征向量输入经典三级对抗生成网络,逐级生成逼真图像。本发明所述的交叉注意力编码方法相较其他方法效果提升明显,评价指标表现良好,在文本生成图像领域有很大应用价值。

    一种基于极化码的多信源分布式信源信道联合编码方法

    公开(公告)号:CN115622660B

    公开(公告)日:2024-03-26

    申请号:CN202110786700.8

    申请日:2021-07-12

    申请人: 四川大学

    IPC分类号: H04L1/00

    摘要: 本发明针对目前的分布式信源信道联合编码计算复杂、资源消耗大的问题,利用了多个信源之间的统计相关性,提出了基于系统极化码的多信源分布式信源信道联合编码方案,每一个分布式信源的编码使用硬件实现简单的系统极化码,在实际信道中只传输校验位,译码端根据信源之间的相关性生成联合边信息。在此基础上,本发明将打孔技术运用到校验位的传输中,实验结果表明,本发明所提出的分布式信源信道联合编译码方案在误码性能上优异,并且具有计算复杂度低、低功耗等优点。

    一种基于SincNet的短语音说话人识别方法

    公开(公告)号:CN117558280A

    公开(公告)日:2024-02-13

    申请号:CN202210935456.1

    申请日:2022-08-04

    申请人: 四川大学

    IPC分类号: G10L17/02 G10L17/18 G10L17/22

    摘要: 本发明提出了一种基于SincNet的短语音说话人识别方法,在测试语音长度较短的真实场景中,达到较高的说话人识别性能。为了提升说话人身份特征的提取能力,采用Sinc函数实现带通滤波器来替换传统卷积神经网络的卷积层,用不同窗口大小的Sinc滤波器组提取多分辨率的特征,并结合注意力机制增强相关特征;再将特征图输入到SEResNet中得到更高层的特征,通过空洞空间金字塔池化进行多尺度特征融合,最后通过全连接层获得语音分类得分。在TIMIT语料库上进行实验,在0.5s的测试语音条件下分类错误率降低到了7.72%,高于传统CNN等对比方法。本发明可以用于金融证券认证身份,用于司法刑事提供刑罚判处佐证等。

    一种基于通道残差注意力的阿尔兹海默症分类方法

    公开(公告)号:CN117252795A

    公开(公告)日:2023-12-19

    申请号:CN202210634989.6

    申请日:2022-06-07

    申请人: 四川大学

    摘要: 本发明公开了一种基于通道残差注意力的阿尔兹海默症分类方法。该方法通过融合残差模块与通道注意力机制的特点来进行阿尔兹海默症的分类。网络由输入模块、通道分离残差模块,通道注意力模块,输出模块构成。首先针对目前研究中出现的数据集构建出现的问题,在临床医生的指导下制定了数据集的科学划分策略;然后将处理后的数据送入通道分离残差模块提取网络的浅层特征和深层特征,并防止重复的梯度信息;再提取后的特征送入通道注意力模块调整通道之间的权重,得到更加精确的分类特征;最后将特征矩阵送入线性分类层输出分类结果。本方法在医学图像方向,阿尔兹海默症分类领域具有广阔的应用前景。

    一种基于多通道自注意力网络的遥感图像场景分类方法

    公开(公告)号:CN117218520A

    公开(公告)日:2023-12-12

    申请号:CN202210607450.1

    申请日:2022-05-31

    申请人: 四川大学

    摘要: 本发明提出了一种基于多通道自注意力网络的遥感图像场景分类方法。传统方法并未有效结合图像中的局部信息和全局特征,同时对各层特征在通道维度的关系并未进一步挖掘。为解决这一问题,提出了一种融合局部‑全局特征的场景分类模型。方法包括:通过双分支卷积网络提取遥感图像的多尺度特征;随后采用特征融合单元建立多尺度特征间的关系,基于多头注意力机制的Transformer Encoder在通道维度对融合后的特征建模,并推导特征在通道间的关系,进一步扩大全局感受野,以捕捉其语义结构信息,有效提高了网络的分类精度。实验证明,该方法具有很好的实用性,可广泛应用于遥感图像场景的准确识别。