基于超完备傅里叶基的语音信号稀疏表示方法

    公开(公告)号:CN104978972A

    公开(公告)日:2015-10-14

    申请号:CN201510229462.5

    申请日:2015-05-07

    IPC分类号: G10L25/27

    摘要: 本发明公开了一种基于超完备傅里叶基的语音信号稀疏表示方法,其步骤是:根据需要构造超完备傅里叶基;将输入信号进行分帧,进行线性预测估计,获得线性预测系数;利用所获得的线性预测系数求线性预测谱;搜索线性预测谱的局部极大值,获得当前帧语音的共振峰数目;将所获得共振峰数作为依据,利用超完备傅里叶基进行稀疏逼近,以获得稀疏表示系数,即获得语音信号的稀疏表示,从而完成语音信号的稀疏表示。本发明利用线性预测谱的局部极大值与语谱中的共振峰之间的对应关系,通过搜索线性预测谱局部极大值获得的共振峰数目,为稀疏系数中非零元的数目提供了依据,提高了语音稀疏逼近的性能。

    一种视频图像实时共享播放的超分辨率重构方法和系统

    公开(公告)号:CN104159119A

    公开(公告)日:2014-11-19

    申请号:CN201410320064.X

    申请日:2014-07-07

    摘要: 本发明提供一种视频图像实时共享播放的超分辨率重构方法和系统,方法包括构造参考帧图像、运动估计以及参考帧修正,所述参考帧图像构造时,对于非边缘像素点采用双线性插值或双三次插值,对于边缘像素点采用小波插值,由于双线性插值和双三次插值相当于低通滤波器,会使高频信息丢失,使边缘和纹理等细节变得模糊,而小波插值可以很好的保持边缘信息,采用这种方式获得的参考帧图像改善了边缘模糊的现象,提高了超分辨率图像重建结果图像的峰值信噪比,明显改善了图像的边缘效果,从而改善了最终重构的高分辨率图像的质量,解决了现有技术中参考帧图像边缘模糊的技术问题。

    一种并行多核FPGA数字图像实时缩放处理方法和装置

    公开(公告)号:CN104104888A

    公开(公告)日:2014-10-15

    申请号:CN201410312009.6

    申请日:2014-07-01

    IPC分类号: H04N5/262 G06T1/20

    摘要: 一种并行多核FPGA数字图像实时缩放处理方法及装置,该方法中首先获取待处理的原始视频图像数据,将原始视频图像数据输入FPGA芯片,然后确定缩放核数目,并将原始视频图像数据分割成与缩放核数目一致的图像子块,然后将分割后的数据存储到缓存器中,再将缓存器中的数据返回到FPGA中,将每个图像子块分别经由一个缩放核进行并行缩放处理,完成缩放,将缩放后的所有图像子块进行拼接处理后显示。本发明对数字视频图像的高吞吐量、高实时性应用有一定的指导作用。

    一种视频压缩方法及系统

    公开(公告)号:CN104168483A

    公开(公告)日:2014-11-26

    申请号:CN201410324532.0

    申请日:2014-07-08

    摘要: 本发明提供一种视频压缩方法,包括将原始视频信号转换为YUV格式的视频信号,然后将原始视频信号各分量进行分块处理,随后随机方式生成一个各元素符合正态分布的压缩感知观测矩阵,利用该矩阵的不同子集来压缩各图像分块,得到压缩后的图像。该方法兼顾处理效率且获得尽量小的压缩后的数据量,解决了现有技术中压缩算法复杂、不适用于像素级视频的网络实时传输的技术问题,通过该方法可以获得很好的数据视频的压缩效果,压缩后的像素级高清视频可适用于现有的低速网路。

    基于超完备傅里叶基的语音信号稀疏表示方法

    公开(公告)号:CN104978972B

    公开(公告)日:2018-08-10

    申请号:CN201510229462.5

    申请日:2015-05-07

    IPC分类号: G10L25/27

    摘要: 本发明公开了一种基于超完备傅里叶基的语音信号稀疏表示方法,其步骤是:根据需要构造超完备傅里叶基;将输入信号进行分帧,进行线性预测估计,获得线性预测系数;利用所获得的线性预测系数求线性预测谱;搜索线性预测谱的局部极大值,获得当前帧语音的共振峰数目;将所获得共振峰数作为依据,利用超完备傅里叶基进行稀疏逼近,以获得稀疏表示系数,即获得语音信号的稀疏表示,从而完成语音信号的稀疏表示。本发明利用线性预测谱的局部极大值与语谱中的共振峰之间的对应关系,通过搜索线性预测谱局部极大值获得的共振峰数目,为稀疏系数中非零元的数目提供了依据,提高了语音稀疏逼近的性能。