-
公开(公告)号:CN118913402A
公开(公告)日:2024-11-08
申请号:CN202410640517.0
申请日:2024-05-22
申请人: 国能四川华蓥山发电有限公司
IPC分类号: G01F23/22 , G10L17/26 , G10L17/18 , G06F18/213 , G06F18/241 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/084 , G06N3/0985 , G06F123/02
摘要: 本发明提出了一种基于CLDNN的磨煤机料位声纹监测系统,包括声学传感模块、预处理模块,以及特征提取与分类识别模块;声学传感模块利用Φ‑OTDR光纤传感系统采集声纹信号,构建时空矩阵;预处理模块对时空矩阵进行预处理,包括归一化、分帧、加窗等;特征提取与分类识别模块采用改进的CLDNN网络,对预处理后的声纹信号进行自动特征提取。训练时,将预处理后的时空矩阵输入CLDNN中训练,优化模型参数,使用训练好的模型对新采集的声纹信号进行料位识别、分类和预测。本发明利用CLDNN深度学习算法自动提取声纹信号中蕴含的丰富料位状态特征,实现对磨煤机料位的精准识别和预测,提高了能源的利用效率。
-
-
-
公开(公告)号:CN118865951A
公开(公告)日:2024-10-29
申请号:CN202411195416.3
申请日:2024-08-29
申请人: 云伴数字科技(安徽)有限公司
IPC分类号: G10L15/02 , G10L15/06 , G10L15/07 , G10L15/18 , G10L15/19 , G10L15/26 , G10L17/02 , G10L17/04 , G10L17/18
摘要: 本发明公开了一种语音内容识别方法及系统,涉及语音识别技术领域,本发明包括以下步骤:用户确认:在用户首次使用系统时,要求用户朗读一组预定义的句子或数字序列,以收集用户的语音样本,从这些样本中提取语音特征;本发明,通过集成先进的语音信号处理技术和活体检测机制,显著提高了语音识别的准确性和安全性,用户确认模块采用声音模板匹配和活体检测技术,如唇动检测和语音节奏分析,有效区分了真实用户和潜在的欺诈者,确保了只有用户实时的语音才能被系统接受,通过定期更新声音模板以适应用户声音的变化,增强了系统的适应性和长期稳定性。
-
公开(公告)号:CN118824262A
公开(公告)日:2024-10-22
申请号:CN202311404104.4
申请日:2023-10-26
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC分类号: G10L21/007 , G10L17/02 , G10L17/18
摘要: 本申请公开了一种语音转换方法、装置、电子设备及存储介质,其中,语音转换方法包括:调用语音预训练模型对源说话人的第一语音进行处理,得到第一语音的预训练特征,预训练特征表征语音内容;调用先验编码器对第一语音的预训练特征进行处理,得到第一序列,第一序列表征第一语音的预训练特征的第一潜在分布;调用声纹识别模型对目标说话人的第二语音进行处理,得到第一向量,第一向量表征目标说话人的音色特征;之后,调用流模型对第一序列进行处理,得到第二序列,流模型以第一向量作为条件,第二序列表征第一语音的预训练特征的第二潜在分布;最后,调用解码器对第二序列和第一向量进行处理,以实现源说话人和目标说话人之间的音色转换。
-
公开(公告)号:CN118824257A
公开(公告)日:2024-10-22
申请号:CN202410786276.0
申请日:2024-06-18
申请人: 天键电声股份有限公司
发明人: 刘亨宇
IPC分类号: G10L17/20 , G10L17/02 , G10L17/18 , G10L21/0216
摘要: 本发明公开了一种复杂环境下声纹降噪识别方法及系统,涉及声纹降噪识别技术领域,包括采集复杂环境下声音并进行预处理;对环境声音进行实时监测和分析;采用判决反馈机制对环境声音进行降噪处理;重新采集人声信号并进行声纹特征提取;基于提取声纹特征对降噪处理后的环境声音进行声纹识别;对数据进行存储,本发明通过对采集的声音信号进行实时监测与分析,判决反馈机制对环境声音进行降噪处理,预加重和汉明窗处理后的人声信号,从而有效提高声纹识别的准确性,精确地抑制噪声,以及确保声纹特征的完整性和信号的质量。
-
公开(公告)号:CN114708872B
公开(公告)日:2024-10-22
申请号:CN202210284357.1
申请日:2022-03-22
申请人: 青岛海尔科技有限公司 , 海尔智家股份有限公司
发明人: 骆小菊
摘要: 本发明公开了一种语音指令的响应方法及装置、存储介质及电子装置,其中,上述方法包括:获取目标对象的语音指令,并根据语音指令确定目标对象的目标声纹信息;将目标声纹信息输入目标神经网络模型,得到目标对象的预估年龄,其中,目标神经网络模型用于根据输入的声纹信息确定对应的预估年龄;在目标对象的预估年龄位于预设的目标年龄区间的情况下,确定与目标年龄区间具有预设的对应关系的播放设置,所述播放设置包括目标播放音量;将所述播放设置发送至目标设备,控制目标设备按照所述播放设置对所述目标对象的语音指令进行响应。采用上述技术方案,解决无法为不同年龄的用户设置不同的播放音量的问题。
-
公开(公告)号:CN118805226A
公开(公告)日:2024-10-18
申请号:CN202380024225.8
申请日:2023-08-11
申请人: 系统技术专业咨询有限公司
发明人: 崔钟文
IPC分类号: G16H50/20 , G16H80/00 , G16H50/30 , G16H20/00 , G16H40/20 , H04W4/14 , G10L13/08 , G10L17/18 , G10L15/26
摘要: 本发明涉及一种包括老年人和痴呆症患者的老弱者护理服务系统,其中包括:服务提供装置,根据来自监护人终端的管理类型存储预设的语音或文本,并根据设定的时间或周期,将监护人终端的电话号码改为发信人号码,预约发送给受保护人终端或实时呼叫,并将受保护人终端的回复发送给监护人终端或实时呼叫,提供监护人对受保护人的远程管理服务;监护人终端,利用服务提供装置提供的服务应用程序,选择管理类型,根据管理类型预先设置并存储语音或文本,然后,预约设定发送时间或周期,使得由服务提供装置完成预约传送;以及受保护人终端,在没有安装其他的服务应用程序的情况下,接收从服务提供装置中继传送的根据管理类型的语音或文本后并回复。
-
公开(公告)号:CN118506792B
公开(公告)日:2024-10-18
申请号:CN202410961448.3
申请日:2024-07-18
申请人: 青岛科技大学
IPC分类号: G10L17/26 , G10L17/02 , G10L17/04 , G10L17/14 , G10L17/18 , G10L21/0272 , G06N3/0442 , G06N3/0464 , G06N3/0475 , G06N3/08 , G10L21/0208
摘要: 本发明公开基于改进Inception块与SACGAN的海洋哺乳动物叫声数据增强方法,属于音频处理与生成技术领域。其方法对海洋哺乳动物叫声数据进行小波去噪处理提高音频质量;将经过降噪的叫声转换为梅尔谱图进行表示,形成数据集;设计叫声生成网络,在该网络中引入代表海洋哺乳动物种类的标签变量,引导生成器生成指定类型的数据,将改进的Inception块通过在同一层级内使用不同尺寸的卷积核来提取不同感受野下的特征。设计损失函数;使用WaveGlow作为声码器将生成的梅尔谱图重构回高质量音频信号;设计分类实验评估本文方法的有效性。本发明实现了海洋哺乳动物叫声数据增强,有效提高了分类模型的预测精度。
-
公开(公告)号:CN118762706A
公开(公告)日:2024-10-11
申请号:CN202410933866.1
申请日:2024-07-12
申请人: 四川虹微技术有限公司
IPC分类号: G10L21/0232 , G10L21/0264 , G10L17/02 , G10L17/04 , G10L17/18
摘要: 本发明涉及语音处理技术,其公开了一种语音增强的方法及装置,提升语音增强的效果,并减小模型的计算量。本发明中提供的语音增强模型主要包括深度复频编码器、信息提示编码器、深度复频解码器;其中,深度复频编码器是以输入的语音数据的复频谱特征作为输入,输出复频编码结果;信息提示编码器是以输入的语音数据的复频谱特征中的实频部分作为输入,输出信息提示预测结果;深度复频解码器是以输入的语音数据的深度复频编码结果和信息提示预测结果作为输入,输出复频掩模预测结果;最后通过将复频掩模预测结果与输入的语音数据的复频谱特征进行内积运算,获得增强复频谱,对增强复频谱进行反变换获得增强语音。本发明适用于对语音的增强处理。
-
-
-
-
-
-
-
-
-