一种语音唤醒方法、装置、系统及可读介质

    公开(公告)号:CN117409779A

    公开(公告)日:2024-01-16

    申请号:CN202311714796.2

    申请日:2023-12-14

    IPC分类号: G10L15/22 G10L15/26 G10L15/30

    摘要: 本发明提供了一种语音唤醒方法、装置、系统及可读介质,涉及语音识别技术领域,应用于语音唤醒系统的前端,前端与语音唤醒系统的后端通信连接,方法包括:响应于语音交互发起操作,启动语音唤醒系统的前端的语音识别元件;获取语音数据,通过语音识别元件识别语音数据得到语音数据对应的文字数据;基于文字数据确定语音数据中是否存在预设唤醒词;若语音数据中存在唤醒词,停止语音识别元件识别语音数据的操作,向后端发送语音唤醒指令以进行语音交互;若语音数据中不存在唤醒词,重新启动语音识别元件对语音数据进行识别,直至语音数据中存在唤醒词,停止语音识别元件识别语音数据的操作,减少唤醒阶段中服务器负载压力,提高机器唤醒响应效率。

    一种基于多租户的对话模型交互方法、装置及存储介质

    公开(公告)号:CN116881429B

    公开(公告)日:2023-12-01

    申请号:CN202311147563.9

    申请日:2023-09-07

    摘要: 本申请提供了一种基于多租户的对话模型交互方法、装置及存储介质,方法包括:接收目标租户的当前会话信息;当前会话信息中携带有租户标签;租户标签包括:用户标识信息;基于租户标签构建提示词;基于提示词和当前会话信息进行会话文本改写,得到目标会话文本;将目标会话文本输入至预设的对话模型中,输出目标会话文本对应的应答信息;根据用户标识信息,将应答信息返回至目标租户对应的客户端。本申请通过基于当前会话信息中携带的租户标签构造的提示词,对租户的会话信息进行区分识别及应答,不仅解决大模型生成应答信息准确性低的问(56)对比文件冯福伟;李瑛;徐冠宁;杜丽萍;赵桂芬.基于集群架构的物联网身份认证系统.计算机应用.2013,(第S1期),131-134.杨明浩;陶建华.多通道人机交互信息融合的智能方法.中国科学:信息科学.2018,(第04期),79-94.

    一种提高用户交互流畅度的方法和装置

    公开(公告)号:CN116884390A

    公开(公告)日:2023-10-13

    申请号:CN202311140532.0

    申请日:2023-09-06

    IPC分类号: G10L13/08 G10L15/26 H04N21/43

    摘要: 本发明提供了一种提高用户交互流畅度的方法和装置,包括:用户终端采集用户的语音输入数据并发送给后端服务器,以使后端服务器对语音输入数据进行语音识别和语义理解处理得到预处理文本,并将预处理文本对应的答案文本进行流处理,得到流处理后的文本信息;接收后端服务器发送的流处理后的文本信息;将流处理后的文本信息进行分割处理得到文字队列,并将文字队列中的第一元素转化为音频文件,从而构成音频队列;将音频队列中的音频按顺序进行播放并响应动画播放优先级指令;利用文字队列与音频队列协同工作,实现对应答文本实时播报,缩短端到端的响应时长进而减少用户等待时间,同时配合动画播放优先级指令提高用户在听觉、视觉上交互流畅度。

    一种大模型的对话质量评估方法、装置和设备

    公开(公告)号:CN118410791B

    公开(公告)日:2024-10-18

    申请号:CN202410835018.7

    申请日:2024-06-26

    IPC分类号: G06F40/226 G06F16/332

    摘要: 本申请公开了一种大模型的对话质量评估方法、装置和设备,针对客观问答数据组从通识领域和专业领域两个角度分别对待评估模型做出第一应答质量评估值,进而提高客观应答评估的准确性;针对主观问答数据组,利用主观问答数据及预构建的应答评判条件构建第一评估指令,并利用预设参考大模型处理第一评估指令,获得待评估模型的第二应答质量评估值。根据第一应答质量评估值和第二应答质量评估值,从主客观方面进行综合评估,使得评估等级结果更加合理、科学,相比现有大模型的质量评估指标单一的缺陷,本申请的评估指标更为全面,且评估方位也更为全面,进而可以提交的应答质量评估等级更准确。

    一种提高大语言模型推理并发量的方法、装置和计算设备

    公开(公告)号:CN118153693A

    公开(公告)日:2024-06-07

    申请号:CN202410582798.9

    申请日:2024-05-11

    IPC分类号: G06N5/04 G06F18/2411

    摘要: 本申请公开了一种提高大语言模型推理并发量的方法、装置和计算设备,该提高大语言模型推理并发量的方法包括:在获取到用户请求时,将所述用户请求添加到预设的等待队列中;基于所述等待队列在预设的推理队列中构建请求任务序列,其中,所述请求任务序列由用户请求构成;调用目标模型对所述推理队列中的请求任务序列进行推理;实时检测推理结果,并在检测到所述请求任务序列中的任一用户请求推理完成时,生成返回给用户的应答文本,将推理完成的用户请求从所述请求任务序列中剔除,并基于所述等待队列更新所述请求任务序列;对更新后的请求任务序列重复进行推理和检测,直至所述推理队列为空。本申请旨在解决模型的推理效率低的问题。

    一种应用于线上虚拟展馆的导览交互方法、装置及设备

    公开(公告)号:CN117590986A

    公开(公告)日:2024-02-23

    申请号:CN202410078626.8

    申请日:2024-01-19

    摘要: 本申请提供一种应用于线上虚拟展馆的导览交互方法、装置及设备,涉及数字多媒体技术领域,用于解决虚拟展馆的观展效果与用户体验感差的问题。所述方法应用于终端,所述终端用于提供图形用户界面,且,所述终端与服务器通信,包括:响应于登录操作,通过图形用户界面显示目标场景的初始化页面,初始化页面至少包括第一区域;接收服务器发送的第一询问请求;响应于第一询问请求,若用户选择预设路径游览方式,则在第一区域内按照预设路径进行移动,以使图形用户界面对第一区域进行展示;若用户选择用户自行规划游览方式,则基于用户进行的方向控制操作,以使图形用户界面对第一区域进行展示,进一步提高虚拟展馆内对展品的展出效果与用户体验感。

    一种语音唤醒方法、装置、系统及可读介质

    公开(公告)号:CN117409779B

    公开(公告)日:2024-02-23

    申请号:CN202311714796.2

    申请日:2023-12-14

    IPC分类号: G10L15/22 G10L15/26 G10L15/30

    摘要: 本发明提供了一种语音唤醒方法、装置、系统及可读介质,涉及语音识别技术领域,应用于语音唤醒系统的前端,前端与语音唤醒系统的后端通信连接,方法包括:响应于语音交互发起操作,启动语音唤醒系统的前端的语音识别元件;获取语音数据,通过语音识别元件识别语音数据得到语音数据对应的文字数据;基于文字数据确定语音数据中是否存在预设唤醒词;若语音数据中存在唤醒词,停止语音识别元件识别语音数据的操作,向后端发送语音唤醒指令以进行语音交互;若语音数据中不存在唤醒词,重新启动语音识别元件对语音数据进行识别,直至语音数据中存在唤醒词,停止语音识别元件识别语音数据的操作,减少唤醒阶段中服务器负载压力,提高机器唤醒响应效率。

    一种流式语音识别方法、装置、介质及设备

    公开(公告)号:CN117457003A

    公开(公告)日:2024-01-26

    申请号:CN202311801603.7

    申请日:2023-12-26

    摘要: 本申请的实施例公开了一种流式语音识别方法、装置、介质及设备,涉及智能语音对话技术领域,本申请通过启动监听任务来监听流式语音识别,实时获取后端与语音识别模块的连接状态,在其处于断开状态时,通过断开时对应的时间戳与启动监听任务对应的时间戳之间的差值大小,确认引起中断的原因并进而确定中断事件类别,确认后根据不同情况的中断对应发起重连请求,并与语音识别模块重新连接继续进行流式语音识别,既能确保对话交互的流畅,又能保证有效信息不丢失,提升语音识别的质量。

    一种提高用户交互流畅度的方法和装置

    公开(公告)号:CN116884390B

    公开(公告)日:2024-01-26

    申请号:CN202311140532.0

    申请日:2023-09-06

    IPC分类号: G10L13/08 G10L15/26 H04N21/43

    摘要: 本发明提供了一种提高用户交互流畅度的方法和装置,包括:用户终端采集用户的语音输入数据并发送给后端服务器,以使后端服务器对语音输入数据进行语音识别和语义理解处理得到预处理文本,并将预处理文本对应的答案文本进行流处理,得到流处理后的文本信息;接收后端服务器发送的流处理后的文本信息;将流处理后的文本信息进行分割处理得到文字队列,并将文字队列中的第一元素转化为音频文件,从而构成音频队列;将音频队列中的音频按顺序进行播放并响应动画播放优先级指令;利用文字队列与音频队列协同工作,实现对应答文本实时播报,缩短端到端的响应时长进而减少用户等待时间,同时配合动画播放优先级指令提高用户在听觉、

    一种音画同步的调整方法、装置和电子设备

    公开(公告)号:CN116958331A

    公开(公告)日:2023-10-27

    申请号:CN202311211973.5

    申请日:2023-09-20

    IPC分类号: G06T13/20 G06T15/02

    摘要: 本发明实施例提供了一种音画同步的调整方法、装置和电子设备,通过渲染引擎加载基础模型、动画姿态控制模型和音频队列,以及设置音频和动画匹配规则;音频和动画匹配规则是判断音频队列中音频播放状态,并根据判断结果匹配对应的动画进行播放的规则;从动画姿态控制模型中获取待机动画,将待机动画作用于基础模型上,并设置待机动画的播放状态;监听音频队列是否为空队;如果否,则对音频队列中新的待播放音频依次进行播放,并根据音频和动画匹配规则配置对应的音频动画作用于基础模型上;确保音频播放状态与动画类别能够高度同步,进而保证音画同步;以及避免了由于动画类别切换时差与音频播放延迟时差不一致而造成的音画不同步问题。