-
公开(公告)号:CN209118747U
公开(公告)日:2019-07-16
申请号:CN201821841399.6
申请日:2018-11-09
申请人: 西北民族大学
发明人: 马希刚
摘要: 本实用新型公开了一种弦鸣乐器智能调律装置;包括声音传感器模块、音频编解码器、单片机、扬声器、耳机、数码管驱动模块、数码管、电机驱动模块、正反转模块、伺服电机和减速机;采用音频编解码器和单片机处理的方式,针对性强,使用方便,效果好;并利用单片机还对频偏与伺服电机控制量进行匹配,通过电机驱动模块、正反转模块驱动伺服电机和减速机,进而驱动弦轴套管的方法,完成对弦鸣乐器的音律调节;调制后的声音信号经音频编解码器解码后,通过耳机或喇叭进行发音;具有使用操作方便、直观、测量准确、调音精度高、原理简单等特点。
-
公开(公告)号:CN206758124U
公开(公告)日:2017-12-15
申请号:CN201720587821.9
申请日:2017-05-10
申请人: 巢湖学院
摘要: 本实用新型涉及声纹识别技术领域,尤其为一种噪声环境下基于耳蜗倒谱系数的声纹识别装置,包括声纹识别主体,所述声纹识别主体的内腔中设有声音发送模块、声音接收模块、中央处理器、声纹识别模块、数字滤波器、自适应滤波器、Mel频率滤波器、Gammatone滤波器和蓄电池,本实用新型结构设计巧妙,操作简单,且方便人们使用,利用自适应滤波器当在输入过程的统计特性不明确,或在输入过程的统计特性发生改变时,它可以调整自己的参数,进而达到某种最佳准则的要求,利用Mel频率滤波器能够反映人的语音特征,并且它没有任何前提假设,具有良好的识别性能,利用Gammatone滤波器用于耳蜗听觉模型,用来模拟人耳听觉频率响应。
-
-
公开(公告)号:CN118942485A
公开(公告)日:2024-11-12
申请号:CN202411009540.6
申请日:2024-07-26
申请人: 常州市威尔莱炉业有限公司
发明人: 王鹏宇
IPC分类号: G10L25/48 , F23N1/00 , G10L25/45 , G10L25/18 , G10L25/24 , G10L19/02 , G10L19/022 , G10L21/0316 , G10L21/0232
摘要: 本发明公开了一种音控燃气控制系统、方法及装置,涉及音控燃气技术领域,用以调整产生的火焰的高度变化,包括音频模块、变换分析模块、驱动模块、至少一比例阀,音频模块适用于对离散的音频数据进行预处理,并根据预处理的结果而产生复数形式数据,变换分析模块适用于根据复数形式数据进行傅里叶变换,以产生多个频域数据,以及对频域数据进行频谱分析,以产生脉宽调制数据,驱动模块适用于接收脉宽调制数据并根据脉宽调制数据而转换出开度控制信号,比例阀具有燃气阀门,比例阀适用于根据开度控制信号而调整燃气阀门的开合状态,使燃气火焰随音乐实现更佳的律动效果。
-
公开(公告)号:CN118609602B
公开(公告)日:2024-11-12
申请号:CN202410704261.5
申请日:2024-05-31
申请人: 江苏声望声学装备有限公司
摘要: 本发明涉及语音处理技术领域,且公开了一种基于语音信号的环境混响程度判断方法及系统,基于语音信号的环境混响程度判断方法通过判断系统进行判断,判断系统包括多维采集模块、混响分析模块和评估管控模块,判断方法包括以下步骤:步骤一、录制多段不同频率的语音信号,且每段语音信号时长相同;步骤二、在测试环境中输出语音信号,并进行采样,多维采集模块针对不同的数据源分类采集数据集;步骤三、综合分析语音信号在环境空间中能量衰减趋势和传播特性,混响分析模块对应计算生成波形特征Bxtz、频谱特征Putz和混响时间Hxsj;步骤四、评估管控模块判断测试环境混响程度,并对应生成管控报告。
-
公开(公告)号:CN115273886B
公开(公告)日:2024-11-12
申请号:CN202210963653.4
申请日:2022-08-11
申请人: 四川轻化工大学
IPC分类号: G10L21/0232 , G10L25/18 , G10L25/27
摘要: 本发明属于语音增强技术领域,尤其涉及一种单通道语音增强的方法;本发明将VGG19模块作为U‑Net网络模型的编码器,并将FED‑former模型嵌入U‑Net网络模型的编码器和解码器部分来构建特征提取模型,在改善了解码器对于频域掩码输出能力的同时也减少了本模型对于长时间序列的预测误差。
-
公开(公告)号:CN118918911A
公开(公告)日:2024-11-08
申请号:CN202411396078.X
申请日:2024-10-08
申请人: 浙江吉利控股集团有限公司 , 吉利汽车研究院(宁波)有限公司
IPC分类号: G10L21/007 , G10L25/03 , G10L25/18 , G10L25/30
摘要: 本申请提供一种歌曲人声调整方法、装置、终端设备、介质及产品。根据本申请的一个示例,该方法应用于终端设备,该方法可以包括:将歌曲中的第一时域信号转换为第一时频域信号;对第一时频域信号进行特征提取,得到时频域音频特征;将时频域音频特征输入到人声提取模型,获得人声提取模型输出的时频掩蔽,时频掩蔽用于表示第一时频域信号中的人声信号;基于时频掩蔽对所述第一时频域信号进行调整,得到第二时频域信号;将第二时频域信号转换为第二时域信号,得到调整后的歌曲,可以对歌曲中的人声信号进行分离和调整,实现在终端设备上实时调整歌曲中的人声音量。
-
公开(公告)号:CN118335056B
公开(公告)日:2024-11-08
申请号:CN202410593684.4
申请日:2024-05-14
申请人: 江苏华明国安技术有限公司
IPC分类号: G10L13/02 , G10L13/027 , G10L13/08 , G10L25/18 , G06N3/08
摘要: 本发明公开了基于上下文感知的自适应语音播报方法和系统,包括:S1:使用有效字符合集对播报文本进行清洗,并对清洗后的播报文本进行分词;S2:基于共现矩阵和互信息提取分词结果中的上下文特征;S3:使用基于深度学习的端到端语音合成网络构建自适应语音播报网络,设定自适应语音播报网络的输入、输出和损失函数;S4:使用梯度下降方法更新自适应语音播报网络参数,获得训练完成的自适应语音播报网络;S5:使用训练完成的自适应语音播报网络与声码器对输入的新播报文本生成播报语音,并对生成的播报语音进行后处理。本发明能够利用上下文特征提取技术,使语音合成系统能够理解并适应各种文本内容和语境,生成更自然、流畅的语音播报。
-
公开(公告)号:CN118197344B
公开(公告)日:2024-11-08
申请号:CN202410327345.1
申请日:2024-03-21
申请人: 广东科技学院
发明人: 田野
IPC分类号: G10L21/0264 , G10L21/0208 , G10L25/21 , G10L25/18
摘要: 本发明涉及音频噪声过滤技术领域,具体涉及一种智慧物联网多媒体教学管理方法及系统,本发明根据多媒体教学音频数据的音频波动振幅的分布情况和音频波动相似情况进行分析,得到含有人声信息的待测教学音频区间;进一步对待测教学音频区间对应的语谱图的灰度分布情况进行分析,得到各个待测教学音频区间中极值点的噪声干扰程度;根据噪声干扰程度和极值点的分布得到的有效极值点对多媒体教学音频数据进行经验模态分解去噪处理,得到多媒体教学去噪音频数据,最后将多媒体教学去噪音频数据进行压缩存储,从而进行物联网多媒体教学管理。本发明通过获取有效极值点进行经验模态分解去噪处理的方法对物联网多媒体教学数据的管理效果更好。
-
公开(公告)号:CN118900300A
公开(公告)日:2024-11-05
申请号:CN202310499402.X
申请日:2023-05-05
申请人: 北京小米移动软件有限公司
IPC分类号: H04M1/72454 , H04M1/72403 , G10L25/18 , G10L25/24 , G10L25/27 , G10L25/30 , G10L25/51
摘要: 本申请提出一种数据处理方法、装置、电子设备和存储介质,其中,方法包括:获取语音采集装置采集的环境语音数据,对环境语音数据进行语音信号处理,得到环境语音数据的频谱图,根据频谱图包括的语音特征,对环境语音数据对应的目标场景进行识别,响应于识别得到环境语音数据对应的目标场景,启动和场景对应的应用程序,其中,应用程序用于提供和场景对应的服务。基于采集的环境的语音数据,识别对应的目标场景,并在识别得到对应的目标场景的情况下,自动启动和目标场景匹配的应用程序,以提供对应的服务,提高了效率和便利性。
-
-
-
-
-
-
-
-
-