一种大模型的对话质量评估方法、装置和设备

    公开(公告)号:CN118410791A

    公开(公告)日:2024-07-30

    申请号:CN202410835018.7

    申请日:2024-06-26

    IPC分类号: G06F40/226 G06F16/332

    摘要: 本申请公开了一种大模型的对话质量评估方法、装置和设备,针对客观问答数据组从通识领域和专业领域两个角度分别对待评估模型做出第一应答质量评估值,进而提高客观应答评估的准确性;针对主观问答数据组,利用主观问答数据及预构建的应答评判条件构建第一评估指令,并利用预设参考大模型处理第一评估指令,获得待评估模型的第二应答质量评估值。根据第一应答质量评估值和第二应答质量评估值,从主客观方面进行综合评估,使得评估等级结果更加合理、科学,相比现有大模型的质量评估指标单一的缺陷,本申请的评估指标更为全面,且评估方位也更为全面,进而可以提交的应答质量评估等级更准确率。

    一种提升人机对话交互体验感的方法、装置、设备及介质

    公开(公告)号:CN117496973A

    公开(公告)日:2024-02-02

    申请号:CN202410002494.0

    申请日:2024-01-02

    摘要: 本申请提供一种提升人机对话交互体验感的方法、装置、设备及介质,涉及智能语音对话技术领域,用于解决人机语音交互过程中,针对复杂问题的处理在智能度、交互自然流畅度上存在一定缺陷,用户体验感差的问题。该方法包括:建立全双工模式下异步通信的第一通信任务和第二通信任务;在通过所述第二通信任务对第一语音数据对应的第一语音识别结果进行处理的过程中,通过所述第一通信任务接收到第二语音数据的情况下,获取所述第二语音数据对应的第二识别文本;判断第一识别文本与所述第二识别文本的语义意图是否相关;若所述第一识别文本与所述第二识别文本的语义意图不相关,则停止所述第一语音数据的处理,并执行所述第二语音数据的处理。

    一种语音控制终端界面的方法、装置及系统

    公开(公告)号:CN117198291A

    公开(公告)日:2023-12-08

    申请号:CN202311474968.3

    申请日:2023-11-08

    IPC分类号: G10L15/22 G10L15/30 G10L17/22

    摘要: 本发明提供了一种语音控制终端界面的方法、装置及系统,涉及智能语音交互的技术领域,该方法包括:通过图形用户界面显示目标场景的初始化页面;响应作用于目标元素对象的控制操作,以获取麦克风的访问权限,以及,在初始化页面显示第二区域;通过麦克风响应语音指令,将语音指令发送至服务器,以使服务器根据语音指令的颗粒度确定响应内容;接收服务器发送的包含响应内容的第一响应请求;提取响应内容,控制图形用户界面按照响应内容进行展示。本发明提供的语音控制终端界面的方法、装置及系统,通过语音控制交互界面,可以解放双手且不需要额外设备进行辅助操控,极大地提升了用户体验。

    一种文件下载方法、装置和计算设备

    公开(公告)号:CN118018543A

    公开(公告)日:2024-05-10

    申请号:CN202410162489.6

    申请日:2024-02-05

    摘要: 本申请公开了一种文件下载方法、装置和计算设备,该文件下载方法包括:获取用户的文件下载请求,其中,文件下载请求中包含有待下载文件的文件标识符;检测预设的全局Map映射关系中是否存在对应于文件标识符的观测点;若存在观测点,则将文件下载请求加载至对应于观测点的通知队列中进行等待;对观测点通知队列中的首个文件下载请求进行文件缓存;基于首个文件下载请求的文件缓存结果向观测点的通知队列中各在后文件下载请求所对应的用户发送下载反馈信息。本申请旨在解决文件并发下载效率较低的技术问题,能够有效提高文件并发下载的效率。

    一种语音控制终端界面的方法、装置及系统

    公开(公告)号:CN117198291B

    公开(公告)日:2024-01-23

    申请号:CN202311474968.3

    申请日:2023-11-08

    IPC分类号: G10L15/22 G10L15/30 G10L17/22

    摘要: 本发明提供了一种语音控制终端界面的方法、装置及系统,涉及智能语音交互的技术领域,该方法包括:通过图形用户界面显示目标场景的初始化页面;响应作用于目标元素对象的控制操作,以获取麦克风的访问权限,以及,在初始化页面显示第二区域;通过麦克风响应语音指令,将语音指令发送至服务器,以使服务器根据语音指令的颗粒度确定响应内容;接收服务器发送的包含响应内容的第一响应请求;提取响应内容,控制图形用户界面按照响应内容进行展示。本发明提供的语音控制终端界面的方法、装置及系统,通过语音控制交互界面,可以解放双手且不需要额外设备进行辅助操控,极大地提升了用户体验。

    一种基于意图识别的语音交互方法、装置及存储介质

    公开(公告)号:CN117059074B

    公开(公告)日:2024-01-19

    申请号:CN202311287625.6

    申请日:2023-10-08

    摘要: 本申请提供了一种基于意图识别的语音交互方法、装置及存储介质,方法包括:获取客户端发送的语音会话对应的第一文字片段;根据预设的多个对话场景对应的意图识别优先级,对第一文字片段进行场景意图识别,得到目标意图和目标关联度;如果目标关联度未超过预设关联阈值,通过预设的对话大模型对第一文字片段进行处理,得到第一文字片段对应的应答结果;如果目标关联度超过阈值,基于目标关联度对应的目标对话场景对第一文字片段和目标意图进行处理,输出第一文字片段对应的应答结果;将第一文字片段对应的应答结果返回至客户端。以解决现有技术中因语音交互功能单一而导致的回复单一无趣、主题不一致、答非所问等问题,提高用

    一种基于多租户的对话模型交互方法、装置及存储介质

    公开(公告)号:CN116881429A

    公开(公告)日:2023-10-13

    申请号:CN202311147563.9

    申请日:2023-09-07

    摘要: 本申请提供了一种基于多租户的对话模型交互方法、装置及存储介质,方法包括:接收目标租户的当前会话信息;当前会话信息中携带有租户标签;租户标签包括:用户标识信息;基于租户标签构建提示词;基于提示词和当前会话信息进行会话文本改写,得到目标会话文本;将目标会话文本输入至预设的对话模型中,输出目标会话文本对应的应答信息;根据用户标识信息,将应答信息返回至目标租户对应的客户端。本申请通过基于当前会话信息中携带的租户标签构造的提示词,对租户的会话信息进行区分识别及应答,不仅解决大模型生成应答信息准确性低的问题,还能解决面对不同用户对应独立部署对话大模型服务器时造成的资源浪费的问题。

    一种提高大语言模型推理并发量的方法、装置和计算设备

    公开(公告)号:CN118153693B

    公开(公告)日:2024-08-09

    申请号:CN202410582798.9

    申请日:2024-05-11

    IPC分类号: G06N5/04 G06F18/2411

    摘要: 本申请公开了一种提高大语言模型推理并发量的方法、装置和计算设备,该提高大语言模型推理并发量的方法包括:在获取到用户请求时,将所述用户请求添加到预设的等待队列中;基于所述等待队列在预设的推理队列中构建请求任务序列,其中,所述请求任务序列由用户请求构成;调用目标模型对所述推理队列中的请求任务序列进行推理;实时检测推理结果,并在检测到所述请求任务序列中的任一用户请求推理完成时,生成返回给用户的应答文本,将推理完成的用户请求从所述请求任务序列中剔除,并基于所述等待队列更新所述请求任务序列;对更新后的请求任务序列重复进行推理和检测,直至所述推理队列为空。本申请旨在解决模型的推理效率低的问题。

    一种数字人的交互评估方法、装置、存储介质和设备

    公开(公告)号:CN118279704A

    公开(公告)日:2024-07-02

    申请号:CN202410712819.4

    申请日:2024-06-04

    摘要: 本申请公开了一种数字人的交互评估方法、装置、存储介质和设备,从数字人的对话文本应答质量、情绪一致性的偏离度、声音嘴唇同步偏离度以及面部表情和肢体动作丰富度等四个方面构建评估体系,利用多个不同层次的评估指标进行综合评价,以提高评估数字人模型在多模态下交互性能的准确率。另外,基于用户对评估指标侧重点的不同,可以适应性调整每个评估指标对应的权重值,以满足不同用户在不同应用场景下对待评估模型侧重点上评估差异的需求,对应个性化地反映数字人模型在多模态下的交互性能。

    一种音画同步的调整方法、装置和电子设备

    公开(公告)号:CN116958331B

    公开(公告)日:2024-01-19

    申请号:CN202311211973.5

    申请日:2023-09-20

    IPC分类号: G06T13/20 G06T15/02

    摘要: 本发明实施例提供了一种音画同步的调整方法、装置和电子设备,通过渲染引擎加载基础模型、动画姿态控制模型和音频队列,以及设置音频和动画匹配规则;音频和动画匹配规则是判断音频队列中音频播放状态,并根据判断结果匹配对应的动画进行播放的规则;从动画姿态控制模型中获取待机动画,将待机动画作用于基础模型上,并设置待机动画的播放状态;监听音频队列是否为空队;如果否,则对音频队列中新的待播放音频依次进行播放,并根据音频和动画匹配规则配置对应的音频动画作用于基础模型上;确保音频播放状态与动画类别能够高度同步,进而保证音画同步;以及避免了由于动画类别切换时(56)对比文件CN 112995730 A,2021.06.18CN 114630170 A,2022.06.14CN 104853239 A,2015.08.19CN 114302192 A,2022.04.08CN 110267064 A,2019.09.20CN 116527980 A,2023.08.01CN 111988647 A,2020.11.24US 5913062 A,1999.06.15孟春宁.基于关键帧和指示符运动模型的教学视频压缩算法《.激光与光电子学进展》.2018,第55卷(第10期),124-135.