一种用于声场合成的声场信息采集方法

    公开(公告)号:CN103438985A

    公开(公告)日:2013-12-11

    申请号:CN201310353642.5

    申请日:2013-08-14

    IPC分类号: G01H17/00

    摘要: 本发明公开了一种用于声场合成的声场信息采集方法,属于信号处理技术领域。用平面传声器阵列采集平面上特定离散位置的声压数据构成训练数据库,该训练数据库用于训练GMM参数,以建立声压与空间信息的高斯混合模型,回归预测模块基于该模型对采集平面上任意位置的声场声压进行回归预测,从而获得采集平面上完整的声场声压信息。

    一种基于头部姿态的人机交互方法

    公开(公告)号:CN103425970A

    公开(公告)日:2013-12-04

    申请号:CN201310385751.5

    申请日:2013-08-29

    IPC分类号: G06K9/00

    摘要: 本发明公开了一种基于头部姿态的人机交互方法,属于信号处理技术领域。首先:利用预处理方法来处理视频采集图像的偏色问题;其次:利用肤色模型进行人脸检测与定位;第三:利用人脸区域中眉毛和眼睛灰度梯度变化大的特点,来完成眉毛与眼睛区域的定位;第四:利用Hough圆检测方法检测瞳孔位置;第五:根据瞳孔灰度较大的特点,利用求质心的方法进行瞳孔精确定位;第六:利用人眼定位的结果来完成五种头部姿态判断;第七:将头部姿态判断结果用于人机交互。

    一种基于总体最小二乘的无线传感器网络两步定位方法

    公开(公告)号:CN103338516A

    公开(公告)日:2013-10-02

    申请号:CN201310307024.7

    申请日:2013-07-19

    IPC分类号: H04W64/00 H04W84/18

    摘要: 本发明公开了一种基于总体最小二乘的无线传感器网络两步定位方法,属于信号处理技术领域。本发明包括拟合模型参数获取模块、距离估计模块及位置定位模块;拟合模型参数获取模块服务于距离估计及位置定位模块,预先采集实际环境中参考节点与终端相对距离以及对应的RSS值,将两者进行关系曲线模型拟合训练,获得模型参数;距离估计模块根据拟合模型训练得到的参数,利用实时采集的RSS值进行距离估计,根据RSS值,选择不同的模型参数进行估计;由距离估计模块获得的距离及参考节点坐标作为位置定位模块输入,位置定位模块输出是未知节点坐标的估计值。

    一种传真ANSam信号的检测装置及其检测方法

    公开(公告)号:CN103281472A

    公开(公告)日:2013-09-04

    申请号:CN201310202742.8

    申请日:2013-05-27

    IPC分类号: H04N1/32 H04N1/00

    摘要: 本发明公开了一种传真ANSam信号的检测装置及其检测方法,所述的装置包括SNR增强滤波器、2100Hz检测器、相位翻转检测器、调幅系数检测器和判决器;SNR增强滤波器的输出端分别与2100Hz检测器、相位翻转检测器和调幅系数检测器连接;2100Hz检测器、相位翻转检测器和调幅系数检测器的输出端分别接判决器。本发明的2100Hz检测器不是直接计算2100Hz频谱,而是将一个周期(80点)分成4部分,根据相邻帧的频谱关系,间接计算2100Hz频谱,大幅度地降低计算量。本发明能够降低系统的复杂度,同时不受频率偏移的影响,在低信噪比下,仍能够准确检测输入信号的相位是否存在翻转及是否存在调幅信号。

    一种人工语音带宽扩展的方法

    公开(公告)号:CN103258543A

    公开(公告)日:2013-08-21

    申请号:CN201310130081.2

    申请日:2013-04-12

    IPC分类号: G10L21/038

    摘要: 本发明公开了一种人工语音带宽扩展的方法。其工作过程如下:窄带语音信号经过曲线拟合模块后输入到外推高频包络模块处理,外推高频包络模块的输出信号进入频谱成型模块;窄带语音信号经过特征提取模块后每帧得到一组线性预测系数,利用线性预测系数构造自回归模型及滤波模块,将白噪声通过此AR模型进行处理产生与低频相关的高频噪声随机序列,高频噪声随机序列进入频谱成型模块;频谱成型模块输出高频语音;高频语音与原始窄带语音信号经过语音合成模块得到宽带语音。

    一种基于G.711.1的语音带宽扩展的装置和方法

    公开(公告)号:CN102522092B

    公开(公告)日:2013-06-19

    申请号:CN201110422386.1

    申请日:2011-12-16

    IPC分类号: G10L21/038

    摘要: 本发明公开了一种基于G.711.1的语音带宽扩展的装置和方法。本发明将G.711.1协议中的高频语音码流进一步压缩,将压缩后的数据使用最低有效位的水印嵌入算法嵌入到窄带语音的编码码流中,解码端使用提取出的高频码流合成宽带语音的高频部分,从而得到宽带语音。本发明提供了分层编码的新解决方案,在窄带语音的传输中建立一条隐藏的信道,用于传输分层编码协议中高频信号的编码码流。这样既利用了分层编码得出宽带语音听觉效果好的优势,同时不会改变现有网络的传输速率。经仿真测试,该方法得到的宽带语音引入的高频噪声小,听觉效果跟原始宽带语音相差极小。

    一种基于深度学习架构的骨传导语音信号传输方法

    公开(公告)号:CN118692473A

    公开(公告)日:2024-09-24

    申请号:CN202410898777.8

    申请日:2024-07-05

    摘要: 本发明公开了一种基于深度学习架构的骨传导语音信号传输方法,包括:获取骨传导语音信号以及对应的空气传导语音信号,基于骨传导语音信号与空气传导语音信号建立训练集和测试集,构建基于深度学习架构的骨传导语音编解码器网络,构建骨传导语音编解码器网络的损失函数,在划分好的训练集上训练骨传导语音编解码器网络,利用反向传播算法传递该网络的梯度值,反复迭代该网络参数、控制生成语音逼近空气传导语音信号从而获得最佳权重,完成该骨传导语音编解码器网络的训练过程;将测试集中的骨传导语音输入至加载最佳权重的骨传导语音编码器中,解码后获得对应的空气传导语音信号。本文方法能够在语音编码的同时实现语音增强,降低了使用的复杂度。

    一种骨传导语音信号传输方法
    89.
    发明公开

    公开(公告)号:CN118506793A

    公开(公告)日:2024-08-16

    申请号:CN202410570455.0

    申请日:2024-05-09

    摘要: 本发明公开了一种骨传导语音信号传输方法,该方法将深度学习模型与传统的语音编解码器相结合,提出了一个新的适用于骨传导语音信号的自适应多速率宽带语音编解码器,专门设计了带宽扩展能力,以增强骨传导语音。通过深度学习网络将ISF参数从骨传导语音转换为空气传导语音,以重构骨传导语音的高频成分。还提出了一种新颖的生成对抗网络,集成了多种注意力机制和基于高阶统计量的损失函数,以逼近ISF参数之间复杂的非线性关系。该方法能够在语音编码的同时实现语音增强,降低了使用的复杂度。

    一种基于频域滤波的优化方法

    公开(公告)号:CN113541648B

    公开(公告)日:2024-06-18

    申请号:CN202110745429.3

    申请日:2021-07-01

    发明人: 陈喆 殷福亮 赵研

    IPC分类号: H03H17/02

    摘要: 本发明公开了一种基于频域滤波的优化方法,具体包括:对需要进行滤波的时域长序列信号x(n)进行时域加窗处理获得时域加窗后的分段信号x1(n),x2(n),...,xDA(n);根据用户的滤波要求自行设计滤波器函数对信号进行频域加窗处理获得时域滤波器函数h(n);对获取的分段信号x1(n),x2(n),...,xDA(n)和时域滤波器函数h(n)进行FFT计算线性卷积处理从而获得滤波后的分段信号y1(n),y2(n),...,yDA(n);对分段信号y1(n),y2(n),...,yDA(n)进行叠接相加法还原信号处理从而获得滤波后的时域输出信号y(n)。