-
公开(公告)号:CN102736064A
公开(公告)日:2012-10-17
申请号:CN201110092816.8
申请日:2011-04-14
Applicant: 东南大学
IPC: G01S5/20
Abstract: 本发明提供一种基于压缩传感器的助听器声源定位方法,本发明基于差分麦克风阵列,包括以下步骤:采用位于同一平面的全向型麦克风方阵采集声源信号,获得信号的差分模型,建立基于压缩感知的采样信号模型,将声源位置评估问题转化为最优化问题,最后得到最优的重构信号,求出能量峰值即声源所在位置。本发明采用联合多通道CS来采样数据,不需要参考阵元,并以信号帧平均值作为采集输入信号,大大减低了计算量,噪声鲁棒性强。
-
公开(公告)号:CN101841723B
公开(公告)日:2011-08-03
申请号:CN201010182160.4
申请日:2010-05-25
Applicant: 东南大学
Abstract: 本发明公布了一种基于可观测的衰减(Just Noticeable Distortion,JND)和自回归(Auto-regressive,AR)模型的感知视频压缩方法,包括了纹理区域的分割算法和基于自回归模型的合成算法。我们首先用基于JND的分割算法将视频中的纹理区域分割出来,接着用自回归模型合成纹理区域。本发明提出了空时JND模型,准确有效地进行了纹理区域的分割。设计了AR模型,通过简单计算,在保证视频质量的同时,大大提高了实时性。开发了结合人眼视觉特性的视频压缩技术,进一步提高了视频的压缩效率,减少了比特率。
-
公开(公告)号:CN101964049A
公开(公告)日:2011-02-02
申请号:CN201010275823.7
申请日:2010-09-07
Applicant: 东南大学
Abstract: 本发明公布了一种基于分段投影与乐符结构的谱线检测及删除方法,纸质乐谱图像首先通过扫描仪或者数码拍摄设备输入到计算机,然后经过去噪,图像格式变换等预处理操作,变成二值乐谱图像;输入图像经过预处理后,首先计算出乐谱的谱线间距,并以此为参考将整幅图像在垂直方向上分割成若干段,通过对部分特殊图像段进行水平投影处理后获取图像的垂直倾斜度,实现谱线垂直方向的倾斜校正,然后对各段进行水平垂直投影,计算相邻两段投影的互相关,进而实现图像水平倾斜以及谱线弯曲的校正,进一步消除二值图像由于倾斜导致部分直线段出现像素重叠的问题。本发明的能有效的解决“误删”和欠删除现象。
-
公开(公告)号:CN101944180A
公开(公告)日:2011-01-12
申请号:CN201010275635.4
申请日:2010-09-07
Applicant: 东南大学
IPC: G06K9/34
Abstract: 本发明公布了一种基于乐符知识及双投影法的乐符基元分割方法,对乐谱图像进行连通域分析后尽管能够获得乐谱图像的各个连通域,但由于乐谱符号的空间多样性,通常需要将乐谱对象分割成最基本的基元,以减轻乐谱识别的负担并提高识别率。本发明根据需要分割的各种乐符的结构特点,提出了基于乐符知识及双投影法的基元分割算法。考虑到需要进一步分割的连通域通常包含有符干,因此首先对经过初步分割的所得到的各连通域进行垂直投影,并结合音符结构知识判断是否包含有符干,从而确定哪些连通域需要进一步分割,然后再在此基础上采用水平投影法进行基元分割。
-
公开(公告)号:CN101930544A
公开(公告)日:2010-12-29
申请号:CN201010275849.1
申请日:2010-09-07
Applicant: 东南大学
Abstract: 本发明公布了一种基于行游程邻接表的乐谱快速连通域分析方法,所述方法如下,对图像F(x,y)由上至下进行行扫描,记录下各行的黑色游程信息,得到整幅图像的水平黑色游程信息表;建立重要信息统计矩阵向量;判断Yctable中的Flagi是否为1;计算第i行(即下一行)各游程段与第i-1行各游程段的邻接情况;统计游程邻接表第r行(即下一行的第r个游程段所对应的行)中1的个数;去掉废除后连通域编号的其它连通域编号所对应的ltyxsb就是分割后真正的各连通域所对应的像素信息;最后用方框标识出分割区域。
-
公开(公告)号:CN101887721A
公开(公告)日:2010-11-17
申请号:CN201010230506.3
申请日:2010-07-19
Applicant: 东南大学
Abstract: 本发明公布了一种基于心电信号与语音信号的双模态情感识别方法,所述方法包括如下步骤:(1)情感数据的采集;(2)情感特征的提取;(3)判决层融合算法:(3-1)待识别的情感类别包括烦躁、喜悦和平静三个类别,对语音与心电分类器均采用高斯混合模型(GMM)来进行每种情感类别的概率模型的训练,高斯混合模型是成员密度的加权和;(4)特征层融合算法:(4-1)采用PCA方法进行语音特征与心电特征的融合与降维;(4-2)采用(3-1)中所述的高斯混合模型进行训练与识别。本发明融合心电和语音进行双模态情感识别;提取心电的混沌特征进行情感识别;识别性能高。
-
公开(公告)号:CN107886942B
公开(公告)日:2021-09-28
申请号:CN201711055574.9
申请日:2017-10-31
Applicant: 东南大学
Abstract: 本发明公开了一种基于局部惩罚随机谱回归的语音信号情感识别方法,对带有情感信息的语段信号样本进行副语言特征提取、数据映射、局部惩罚嵌入图设计和图分解、回归、分类器分类判决。其中在数据映射阶段,使用了随机生成点进行非线性特征映射;在局部惩罚嵌入图设计和图分解阶段,使用了局部惩罚嵌入图,以加大对类间边缘样本对之间的惩罚权重,生成训练样本的虚拟坐标。与现有方法相比,本发明的方法在语音信号情感识别方面,能够有效地提升系统的识别性能。
-
公开(公告)号:CN103578480B
公开(公告)日:2016-04-27
申请号:CN201210256326.1
申请日:2012-07-24
Abstract: 本发明公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。
-
公开(公告)号:CN101873508B
公开(公告)日:2012-07-04
申请号:CN201010182634.5
申请日:2010-05-25
Applicant: 东南大学
Abstract: 本发明公布了一种基于改进置信传播(Belief Propagation,BP)算法的中间视合成方法,包括如下步骤:步骤1),采用基于改进BP的迭代的方法,来获取每个像素的视差矢量信息;步骤2),检测出遮挡区域,并对遮挡区域的视差进行补偿,然后再进行中间视图的插值计算:首先利用一致性约束条件对图像进行区域的划分,把图像分为遮挡区域、一致区域和模糊区域,与此同时进行遮挡区域的补偿,然后根据各个区域本身的特点采取不同的插值来获取中间视图。本发明改进了BP算法,去除了过度平滑的不良效果,进一步提高了视差计算的准确性。设计了新的插值算法,更好地考虑到了立体图像各个部分的特点,提高了虚拟视图的视觉效果和质量。
-
公开(公告)号:CN101873508A
公开(公告)日:2010-10-27
申请号:CN201010182634.5
申请日:2010-05-25
Applicant: 东南大学
Abstract: 本发明公布了一种基于改进置信传播(Belief Propagation,BP)算法的中间视合成方法,包括如下步骤:步骤1)采用基于改进BP的迭代的方法,来获取每个像素的视差矢量信息;步骤2)检测出遮挡区域,并对遮挡区域的视差进行补偿,然后再进行中间视图的插值计算:首先利用一致性约束条件对图像进行区域的划分,把图像分为遮挡区域、一致区域和模糊区域,与此同时进行遮挡区域的补偿,然后根据各个区域本身的特点采取不同的插值来获取中间视图。本发明改进了BP算法,去除了过度平滑的不良效果,进一步提高了视差计算的准确性。设计了新的插值算法,更好地考虑到了立体图像各个部分的特点,提高了虚拟视图的视觉效果和质量。
-
-
-
-
-
-
-
-
-