-
公开(公告)号:CN117746834B
公开(公告)日:2024-05-24
申请号:CN202410191016.9
申请日:2024-02-21
申请人: 青岛海尔科技有限公司 , 青岛海尔智能家电科技有限公司 , 海尔优家智能科技(北京)有限公司
摘要: 本申请公开了一种基于大模型的语音生成方法及装置、存储介质、电子装置,涉及语音处理领域,上述方法包括:对目标对象输入的用户指令进行解析,以确定用户指令对应的语言风格信息,并生成语言风格信息对应的第一语音;确定第一语音的第一梅尔频谱和第二语音的第二梅尔频谱;根据第一梅尔频谱提取第一语音的第一音色向量;以及根据第二梅尔频谱提取第二语音的第二音色向量;删除第一语音对应的第一语音向量中的第一音色向量,得到第二语音向量,并在第二语音向量中添加第二语音对应的第二音色向量,以生成第三语音,将第三语音确定为语音助手输出的语音,基于上述方案,解决了现有技术中语音助手语料库单调,缺乏语言风格上的变化等问题。
-
公开(公告)号:CN117746834A
公开(公告)日:2024-03-22
申请号:CN202410191016.9
申请日:2024-02-21
申请人: 青岛海尔科技有限公司 , 青岛海尔智能家电科技有限公司 , 海尔优家智能科技(北京)有限公司
摘要: 本申请公开了一种基于大模型的语音生成方法及装置、存储介质、电子装置,涉及语音处理领域,上述方法包括:对目标对象输入的用户指令进行解析,以确定用户指令对应的语言风格信息,并生成语言风格信息对应的第一语音;确定第一语音的第一梅尔频谱和第二语音的第二梅尔频谱;根据第一梅尔频谱提取第一语音的第一音色向量;以及根据第二梅尔频谱提取第二语音的第二音色向量;删除第一语音对应的第一语音向量中的第一音色向量,得到第二语音向量,并在第二语音向量中添加第二语音对应的第二音色向量,以生成第三语音,将第三语音确定为语音助手输出的语音,基于上述方案,解决了现有技术中语音助手语料库单调,缺乏语言风格上的变化等问题。
-