专利检索 ipc:"G10L13/033" 第 1 页

1.

发明公开
基于指派给自动化助理的给定角色动态地适配给定助理输出

公开(公告)号：CN118974822A

公开(公告)日：2024-11-15

申请号：CN202280095063.2

申请日：2022-10-18

申请人： 谷歌有限责任公司

发明人： 马丁·博伊姆尔 , 特胡尚·阿马拉西里瓦德纳 , 罗伯托·皮拉奇尼 , 蒋禄卡·马提尼

IPC分类号： G10L15/22 , G06F3/16 , G06F16/332 , G06F40/40 , G06T13/40 , G10L13/033 , G10L15/183

摘要： 各实现方式涉及基于多个不同的角色当中指派给自动化助理的给定角色来动态地适配给定助理输出。在一些实现方式中，可以生成所述给定助理输出并且随后基于指派给所述自动化助理的所述给定角色对其进行适配。在其他实现方式中，可以生成特定于所述给定角色的所述给定助理输出，并且不必随后针对所述给定角色适配所述给定助理输出。值得注意的是，所述给定助理输出可以包括将合成以向用户可听呈现的文本内容流，以及用于控制客户端设备的显示和/或用于控制所述自动化助理的可视化表示的视觉提示流。各种实现方式利用大语言模型(LLM)或先前利用LLM生成的输出来反映所述给定助理输出中的所述给定角色。

2.

发明授权
语音翻译方法、装置、设备及计算机可读存储介质有权

公开(公告)号：CN118692445B

公开(公告)日：2024-11-12

申请号：CN202411155650.3

申请日：2024-08-22

申请人： 广州趣丸网络科技有限公司

发明人： 张顺四 , 詹皓粤 , 张强

IPC分类号： G10L13/033 , G10L13/027 , G10L13/08 , G10L13/10 , G10L15/00 , G10L15/04 , G10L15/18 , G10L25/30 , G10L25/51 , G06N3/0464

摘要： 本申请公开了一种语音翻译方法、装置、设备及计算机可读存储介质，该方法可实时获取源语音流；提取用于表征源语音流的音调、音高及语气的音色特征；基于此，可用于后续模拟说话人的说话音色；可确定转译语言；对源语音流进行语言转换，获取采用转译语言表示的源语音流的语义表征；基于此，可实现不同语种的语义转换；可对语义表征进行时长预测，得到时长预测结果；将音色特征注入预设的扩散模型，将时长预测结果及语义表征输入至最新的扩散模型，得到离散声学特征；基于离散声学特征，生成与源语音流音色匹配且语种为转译语言的转译语音流；可见，本申请生成的转译语音流的音色可与说出源语音流的说话人匹配，从而，提高用户使用体验。

3.

发明授权
一种中性音色的语音合成方法及相关装置有权

公开(公告)号：CN118629394B

公开(公告)日：2024-10-15

申请号：CN202411099358.4

申请日：2024-08-12

申请人： 湖南快乐阳光互动娱乐传媒有限公司

发明人： 陈智聪 , 尹恒鑫 , 杨杰 , 宋施恩

IPC分类号： G10L13/08 , G10L13/033 , G06N3/0455 , G06N3/084

摘要： 本申请公开了一种中性音色的语音合成方法及相关装置，涉及音频处理技术领域，确定中性音色提示音频和中性音色模型，将待合成的目标文本和中性音色提示音频输入到中性音色模型中，由中性音色模型输出目标文本对应的中性音色音频。基于本发明，通过输入文本即可合成具有中性音色的音频，中性音色位于男性音色与女性音色之间，以此消除语音合成时的性别特征，具有广泛适用性。

4.

发明公开
交互方法、装置、计算机设备和存储介质审中-实审

公开(公告)号：CN118748663A

公开(公告)日：2024-10-08

申请号：CN202410902148.8

申请日：2024-07-06

申请人： 小红书科技有限公司

发明人： 屈驰达 , 请求不公布姓名 , 王泾怡

IPC分类号： H04L51/066 , H04L51/52 , G10L13/033

摘要： 本申请公开了一种交互方法、装置、计算机设备和存储介质。属于通讯交互技术领域，该方法具体可以包括：在会话界面中，获取输入的交互内容；响应于针对交互内容的消息发送事件，发送以目标音色表达交互内容的合成语音消息；其中，目标音色包括交互应用所提供的至少一个推荐音色和/或基于交互应用所提供的音色创建入口执行音色创建操作得到的至少一个音色。基于本申请的方法，用户可根据场景、个人偏好或环境信息等，灵活选择目标音色的类型和数量，通过目标音色来生动有趣的表达交互内容，增加了语音聊天的趣味性和娱乐性，可有效提升针对交互场景所配置的数据处理资源的资源利用率。

5.

发明公开
提供语音合成服务的方法及其系统审中-实审

公开(公告)号：CN118541751A

公开(公告)日：2024-08-23

申请号：CN202280087749.7

申请日：2022-10-20

申请人： LG电子株式会社

发明人： 梁时宁 , 金上起 , 韩成旻

IPC分类号： G10L13/033 , G10L13/08 , G10L13/02

摘要： 公开了提供语音合成服务的方法及其系统。根据本公开的各种实施方式中的至少一个实施方式的提供语音合成服务的方法可以包括以下步骤：通过提供开发工具包的语音合成服务平台接收针对多个预定义第一文本的用于合成说话者的语音的声源数据；使用预先生成的音调转换基础模型来执行针对说话者的声源数据的音调转换；通过语音转换训练，生成针对说话者的语音合成模型；接收第二文本；基于针对说话者的语音合成模型和第二文本，通过语音合成推断生成语音合成模型；以及使用语音合成模型生成合成语音。

6.

发明公开
音效处理方法、装置、存储介质及处理器审中-实审

公开(公告)号：CN118502701A

公开(公告)日：2024-08-16

申请号：CN202310119717.7

申请日：2023-02-15

申请人： 诺博汽车科技有限公司

发明人： 陈刚

IPC分类号： G06F3/16 , G10L13/033 , G10L21/013

摘要： 本申请公开了一种音效处理方法、装置、处理器及存储介质。方法包括：获取待处理的音效数据；确定每个输出端口的音效需求；根据所述音效需求对每个输出端口的音效图进行参数配置；将所述音效数据输入至配置后的音效图中；通过配置后的音效图对所述音效数据进行处理，以使处理后的音效数据与每个输出端口的音效需求一致。通过该方法，提高了音效算法的便捷性和配置音效链路的简洁性与可拓展性，节省开发和维护成本。

7.

发明授权
歌声合成有权

公开(公告)号：CN112951198B

公开(公告)日：2024-08-06

申请号：CN201911156831.7

申请日：2019-11-22

申请人： 微软技术许可有限责任公司

发明人： 卢佩玲 , 栾剑 , 吴洁

IPC分类号： G10L13/02 , G10L13/033 , G10H7/00 , G10H1/00

摘要： 本公开提供了用于歌声合成的方法和装置。可以接收从乐谱中提取的第一乐谱音素信息，所述第一乐谱音素信息包括第一音素以及与所述第一音素相对应的音符的音高和节拍。可以基于所述第一乐谱音素信息，生成与所述第一音素相对应的基频差量和频谱参数。可以通过利用所述基频差量调节所述音符的音高，获得与所述第一音素相对应的基频。可以至少部分地基于所述基频和所述频谱参数，生成与所述第一音素相对应的声学波形。

8.

发明公开
一种语音生成方法、装置、设备和存储介质审中-实审

公开(公告)号：CN118379985A

公开(公告)日：2024-07-23

申请号：CN202410502174.1

申请日：2024-04-25

申请人： 上海脸谱心智智能科技有限公司

发明人： 陆弘远

IPC分类号： G10L13/10 , G10L13/047 , G10L13/033

摘要： 本发明涉及一种语音生成方法、装置、设备和存储介质，其中，方法包括：获取文本内容、标签信息以及权重信息；将所述文本内容、标签信息以及权重信息输入至音色克隆模型，得到符合所述标签信息且与所述文本内容对应的语音信息；其中，所述音色克隆模型在接收到所述文本内容、标签信息以及权重信息后，根据所述标签信息从存储库中找出合成音频样本，根据所述合成音频样本生成speaker嵌入，并将权值信息与所述speaker嵌入相乘，并基于相乘后的结果生成符合所述标签信息且与所述文本内容对应的语音信息。本发明能够根据用户需求生成不同音色的语音内容。

9.

发明授权
语音合成方法、装置、电子设备和存储介质有权

公开(公告)号：CN118197277B

公开(公告)日：2024-07-23

申请号：CN202410598515.X

申请日：2024-05-15

申请人： 国家超级计算天津中心

发明人： 吴琪 , 康波 , 庞晓磊 , 吴晓菲 , 孟祥飞 , 蒋博为 , 徐悦然 , 赵玮

IPC分类号： G10L13/027 , G10L13/033 , G10L13/08

摘要： 本发明实施例公开一种语音合成方法、装置、电子设备和存储介质，方法包括：确定来自参考语音源的参考语音的参考语音编码、第一参考文本编码和第一参考音素编码，以及确定参考文本的第二参考文本编码和第二参考音素编码；对所述第一参考文本编码和所述第二参考文本编码进行拼接，获得第三参考文本编码；对所述第一参考音素编码和所述第二参考音素编码进行拼接，获得第三参考音素编码；将参考语音编码、第三参考文本编码和所述第三参考音素编码输入至训练好的生成式模型，获得目标语音，目标语音是模拟参考语音源说出所述参考文本的语音。有效解决了在语音合成之前对模型进行再训练的问题，且提高了语音合成流畅度、自然度。

10.

发明公开
基于智能语音的电费催缴系统及方法审中-实审

公开(公告)号：CN118335055A

公开(公告)日：2024-07-12

申请号：CN202410586841.9

申请日：2024-05-13

申请人： 国网安徽省电力有限公司营销服务中心

发明人： 倪妍妍 , 郑抗震 , 段玉卿 , 李少飞 , 刘辉舟 , 卢仁杰 , 宋颖冬 , 王明 , 黄华胜 , 顾志杰 , 俞敦伟 , 李重庆 , 冯逸群 , 庄磊 , 黄丹 , 常乐 , 孙伟红 , 张颖 , 吴玲玲 , 曹有霞 , 彭新宇 , 李晨曦

IPC分类号： G10L13/02 , G06F18/2433 , G06Q50/06 , G10L13/033 , H04M3/42 , H04W4/14

摘要： 本发明涉及电力缴费领域，尤其涉及基于智能语音的电费催缴系统及方法，包括收集用户信息，获取用户的电费信息；用户通过语音输入个人信息和电费账户信息，建立用户档案模型；根据用户电费消费水平，将用户划分为不同的电费等级，设置电费催缴次数；结合用户的用电情况和历史缴费记录，分析用户的电费催缴周期，得到电费催缴次数修正量，同时监控电费催缴次数修正量的变化，并自动发送电费催缴提醒；根据获取的用户缴费等信息，通过深度学习对状态异常的用户进行监测。本发明利用智能语音技术系统可以通过语音提示或短信提醒用户及时缴费，避免漏缴或欠费的情况发生；并根据用户的缴费历史、用电习惯等信息，提供个性化的催缴服务。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类