-
公开(公告)号:CN118692445B
公开(公告)日:2024-11-12
申请号:CN202411155650.3
申请日:2024-08-22
申请人: 广州趣丸网络科技有限公司
IPC分类号: G10L13/033 , G10L13/027 , G10L13/08 , G10L13/10 , G10L15/00 , G10L15/04 , G10L15/18 , G10L25/30 , G10L25/51 , G06N3/0464
-
公开(公告)号:CN118629394B
公开(公告)日:2024-10-15
申请号:CN202411099358.4
申请日:2024-08-12
申请人: 湖南快乐阳光互动娱乐传媒有限公司
IPC分类号: G10L13/08 , G10L13/033 , G06N3/0455 , G06N3/084
摘要: 本申请公开了一种中性音色的语音合成方法及相关装置,涉及音频处理技术领域,确定中性音色提示音频和中性音色模型,将待合成的目标文本和中性音色提示音频输入到中性音色模型中,由中性音色模型输出目标文本对应的中性音色音频。基于本发明,通过输入文本即可合成具有中性音色的音频,中性音色位于男性音色与女性音色之间,以此消除语音合成时的性别特征,具有广泛适用性。
-
公开(公告)号:CN118748663A
公开(公告)日:2024-10-08
申请号:CN202410902148.8
申请日:2024-07-06
申请人: 小红书科技有限公司
IPC分类号: H04L51/066 , H04L51/52 , G10L13/033
摘要: 本申请公开了一种交互方法、装置、计算机设备和存储介质。属于通讯交互技术领域,该方法具体可以包括:在会话界面中,获取输入的交互内容;响应于针对交互内容的消息发送事件,发送以目标音色表达交互内容的合成语音消息;其中,目标音色包括交互应用所提供的至少一个推荐音色和/或基于交互应用所提供的音色创建入口执行音色创建操作得到的至少一个音色。基于本申请的方法,用户可根据场景、个人偏好或环境信息等,灵活选择目标音色的类型和数量,通过目标音色来生动有趣的表达交互内容,增加了语音聊天的趣味性和娱乐性,可有效提升针对交互场景所配置的数据处理资源的资源利用率。
-
公开(公告)号:CN118541751A
公开(公告)日:2024-08-23
申请号:CN202280087749.7
申请日:2022-10-20
申请人: LG电子株式会社
IPC分类号: G10L13/033 , G10L13/08 , G10L13/02
摘要: 公开了提供语音合成服务的方法及其系统。根据本公开的各种实施方式中的至少一个实施方式的提供语音合成服务的方法可以包括以下步骤:通过提供开发工具包的语音合成服务平台接收针对多个预定义第一文本的用于合成说话者的语音的声源数据;使用预先生成的音调转换基础模型来执行针对说话者的声源数据的音调转换;通过语音转换训练,生成针对说话者的语音合成模型;接收第二文本;基于针对说话者的语音合成模型和第二文本,通过语音合成推断生成语音合成模型;以及使用语音合成模型生成合成语音。
-
公开(公告)号:CN118502701A
公开(公告)日:2024-08-16
申请号:CN202310119717.7
申请日:2023-02-15
申请人: 诺博汽车科技有限公司
发明人: 陈刚
IPC分类号: G06F3/16 , G10L13/033 , G10L21/013
摘要: 本申请公开了一种音效处理方法、装置、处理器及存储介质。方法包括:获取待处理的音效数据;确定每个输出端口的音效需求;根据所述音效需求对每个输出端口的音效图进行参数配置;将所述音效数据输入至配置后的音效图中;通过配置后的音效图对所述音效数据进行处理,以使处理后的音效数据与每个输出端口的音效需求一致。通过该方法,提高了音效算法的便捷性和配置音效链路的简洁性与可拓展性,节省开发和维护成本。
-
公开(公告)号:CN112951198B
公开(公告)日:2024-08-06
申请号:CN201911156831.7
申请日:2019-11-22
申请人: 微软技术许可有限责任公司
IPC分类号: G10L13/02 , G10L13/033 , G10H7/00 , G10H1/00
摘要: 本公开提供了用于歌声合成的方法和装置。可以接收从乐谱中提取的第一乐谱音素信息,所述第一乐谱音素信息包括第一音素以及与所述第一音素相对应的音符的音高和节拍。可以基于所述第一乐谱音素信息,生成与所述第一音素相对应的基频差量和频谱参数。可以通过利用所述基频差量调节所述音符的音高,获得与所述第一音素相对应的基频。可以至少部分地基于所述基频和所述频谱参数,生成与所述第一音素相对应的声学波形。
-
公开(公告)号:CN118379985A
公开(公告)日:2024-07-23
申请号:CN202410502174.1
申请日:2024-04-25
申请人: 上海脸谱心智智能科技有限公司
发明人: 陆弘远
IPC分类号: G10L13/10 , G10L13/047 , G10L13/033
摘要: 本发明涉及一种语音生成方法、装置、设备和存储介质,其中,方法包括:获取文本内容、标签信息以及权重信息;将所述文本内容、标签信息以及权重信息输入至音色克隆模型,得到符合所述标签信息且与所述文本内容对应的语音信息;其中,所述音色克隆模型在接收到所述文本内容、标签信息以及权重信息后,根据所述标签信息从存储库中找出合成音频样本,根据所述合成音频样本生成speaker嵌入,并将权值信息与所述speaker嵌入相乘,并基于相乘后的结果生成符合所述标签信息且与所述文本内容对应的语音信息。本发明能够根据用户需求生成不同音色的语音内容。
-
公开(公告)号:CN118197277B
公开(公告)日:2024-07-23
申请号:CN202410598515.X
申请日:2024-05-15
申请人: 国家超级计算天津中心
IPC分类号: G10L13/027 , G10L13/033 , G10L13/08
摘要: 本发明实施例公开一种语音合成方法、装置、电子设备和存储介质,方法包括:确定来自参考语音源的参考语音的参考语音编码、第一参考文本编码和第一参考音素编码,以及确定参考文本的第二参考文本编码和第二参考音素编码;对所述第一参考文本编码和所述第二参考文本编码进行拼接,获得第三参考文本编码;对所述第一参考音素编码和所述第二参考音素编码进行拼接,获得第三参考音素编码;将参考语音编码、第三参考文本编码和所述第三参考音素编码输入至训练好的生成式模型,获得目标语音,目标语音是模拟参考语音源说出所述参考文本的语音。有效解决了在语音合成之前对模型进行再训练的问题,且提高了语音合成流畅度、自然度。
-
公开(公告)号:CN118335055A
公开(公告)日:2024-07-12
申请号:CN202410586841.9
申请日:2024-05-13
申请人: 国网安徽省电力有限公司营销服务中心
发明人: 倪妍妍 , 郑抗震 , 段玉卿 , 李少飞 , 刘辉舟 , 卢仁杰 , 宋颖冬 , 王明 , 黄华胜 , 顾志杰 , 俞敦伟 , 李重庆 , 冯逸群 , 庄磊 , 黄丹 , 常乐 , 孙伟红 , 张颖 , 吴玲玲 , 曹有霞 , 彭新宇 , 李晨曦
IPC分类号: G10L13/02 , G06F18/2433 , G06Q50/06 , G10L13/033 , H04M3/42 , H04W4/14
摘要: 本发明涉及电力缴费领域,尤其涉及基于智能语音的电费催缴系统及方法,包括收集用户信息,获取用户的电费信息;用户通过语音输入个人信息和电费账户信息,建立用户档案模型;根据用户电费消费水平,将用户划分为不同的电费等级,设置电费催缴次数;结合用户的用电情况和历史缴费记录,分析用户的电费催缴周期,得到电费催缴次数修正量,同时监控电费催缴次数修正量的变化,并自动发送电费催缴提醒;根据获取的用户缴费等信息,通过深度学习对状态异常的用户进行监测。本发明利用智能语音技术系统可以通过语音提示或短信提醒用户及时缴费,避免漏缴或欠费的情况发生;并根据用户的缴费历史、用电习惯等信息,提供个性化的催缴服务。
-
公开(公告)号:CN118314877A
公开(公告)日:2024-07-09
申请号:CN202410510421.2
申请日:2024-04-26
申请人: 荣耀终端有限公司
IPC分类号: G10L13/10 , G10L13/033 , G10L13/027
摘要: 本申请实施例提供一种个性化语音合成方法、音频模型的训练方法和电子设备,该方法包括:在电子设备开启语音合成功能的情况下,获取需要进行语音合成的文字信息,并提取文字信息对应的语义特征,文字信息包括用户输入的文字信息和电子设备生成的文字信息;获取用户对应的音频特征,音频特征为根据用户进行语音合成功能注册时所录入的语音信息而生成的特征;将音频特征作为第一目标特征,将音频特征与语义特征的融合结果作为第二目标特征,通过音频模型对第一目标特征和第二目标特征进行处理,输出个性化语音,音频模型为根据训练数据中的第一文字信息和第一语音信息进行训练得到的与文本无关的模型。由此可以提高电子设备的个性化语音推理精度。
-
-
-
-
-
-
-
-
-