基于机器学习的婴幼儿哭声增强方法、装置及设备

    公开(公告)号:CN118609605A

    公开(公告)日:2024-09-06

    申请号:CN202411080693.X

    申请日:2024-08-08

    摘要: 本发明涉及音频处理技术领域,解决了现有技术中收集到的婴幼儿哭声受限于杂音的干扰,难以准确区分和提取出有效婴幼儿哭声的问题,提供了一种基于机器学习的婴幼儿哭声增强方法、装置及设备。该方法包括:获取第一音频数据,其中,所述第一音频数据包括至少一段含有婴幼儿哭声的音频数据;对所述第一音频数据进行预处理,得到第一音频数据对应的频谱图;将所述频谱图输入自编码器模型,输出所述第一音频数据中与婴幼儿哭声对应的音频特征信息;根据所述音频特征信息,对含有婴幼儿哭声的音频数据进行处理,得到增强后的第二音频数据。本发明有效地从嘈杂环境中提取并增强了婴幼儿哭声,显著提高了哭声信号的纯净度和识别率。

    一种口才训练的反馈方法、系统、装置及存储介质

    公开(公告)号:CN118609599A

    公开(公告)日:2024-09-06

    申请号:CN202410826484.9

    申请日:2024-06-25

    发明人: 赵璧 吴云川 詹歆

    IPC分类号: G10L25/51 G10L25/60 G10L25/63

    摘要: 本申请提出了一种口才训练的反馈方法、系统、装置及存储介质,该方法包括:获取训练者在当前口才训练时的多模态数据;对多模态数据进行语音与非语言行为分析,得到训练者的语音强度变化数据、语调模式数据以及非语言行为与语音的同步性数据;对语音强度变化数据、语调模式数据以及非语言行为与语音的同步性数据进行口才质量分析,得到训练者在当前口才训练过程中的多维口才质量指标;基于多维口才质量指标,为训练者生成并输出针对性的口才改进建议。本申请能够及时且有效地针对训练者的口才训练表现进行个性化反馈,实现了针对训练者的具体表现进行训练指导,从而可以有效提升训练者的口才训练效率和口才技能。

    一种基于大模型的语音生成技术的英文对话学习系统

    公开(公告)号:CN118609553A

    公开(公告)日:2024-09-06

    申请号:CN202410672449.6

    申请日:2024-05-28

    摘要: 本发明公开了一种基于大模型的语音生成技术的英文对话学习系统,涉及大模型语音生成技术领域,解决了现有技术在情感表达方面仍然有限,现有的英语语音识别模型无法完全模拟人类的情感,导致在部分场景中,模型生成的英语语音所表达的意思,与实际人们所要表达的意思不一致的技术问题;本发明通过获取用户输入的英语语音,并对英语语音进行预处理,得到初始语音;通过对初始语音进行意图分析和情感分析,解决了现有技术在情感表达方面仍然有限的技术问题;通过将回复文本转化为可视化数据;以及通过文本转语音TTS技术将回复文本转化为英语语音,解决了现有技术对英语对话学习太过单一,不利于学习者英语成长进步的问题。

    一种人工智能算法优化的语音识别系统

    公开(公告)号:CN118609550A

    公开(公告)日:2024-09-06

    申请号:CN202410833226.3

    申请日:2024-06-26

    摘要: 本发明公开了一种人工智能算法优化的语音识别系统。本发明通过数据采集模块采集和预处理用户的多模态数据,处理模块处理多模态数据并进行时序关系建模,识别结果生成模块接收并识别处理后的数据生成初步语音识别结果,情感分析模块对初步结果进行情感分析和优先级排序,反馈生成模块通过语音合成技术生成反馈确认信息并播放给用户,用户反馈用于调整系统,数据输出模块将最终的语音发送到移动终端,服务器保护和储存数据供后续调用。此流程通过多模态数据融合和情感分析,优化语音识别的准确性和用户体验,并通过反馈机制和安全存储,确保系统的持续优化和数据安全。

    一种基于AR的情感数据处理方法、装置及电子设备

    公开(公告)号:CN118587757A

    公开(公告)日:2024-09-03

    申请号:CN202410900132.3

    申请日:2024-07-05

    发明人: 崔海涛

    摘要: 本申请提供一种基于AR的情感数据处理方法、装置及电子设备,涉及数据处理领域。在该方法中,获取AR眼镜发送的针对用户的情感数据,用户佩戴有AR眼镜,情感数据包括面部表情数据和用户语音数据;对面部表情数据进行情感识别,得到第一识别结果;对用户语音数据进行语音识别,得到第二识别结果;若确定第一识别结果和第二识别结果均指示用户的情绪状态为消极情绪,则获取当前时刻数据;根据当前时刻数据,生成对应的处理策略,并控制AR眼镜执行处理策略,以缓解用户的消极情绪。实施本申请提供的技术方案,便于提高对情绪的识别准确度。