一种AR/MR设备语音识别的方法和装置及系统

    公开(公告)号:CN112735393A

    公开(公告)日:2021-04-30

    申请号:CN202011587781.0

    申请日:2020-12-29

    发明人: 黄石磊 刘轶 王昕

    摘要: 本发明公开了一种AR/MR设备语音识别的方法和装置及系统。所述方法包括:在AR/MR设备的虚拟视场中显示一投射屏幕和一虚拟屏幕,投射屏幕是将智能手持设备的显示屏幕投射到虚拟视场中形成的;在智能手持设备的显示屏幕上显示一语音识别功能界面;根据用户在智能手持设备语音识别功能界面的操作,进行语音录入和语音识别,将识别出的多个候选结果显示在虚拟屏幕上,对多个候选结果进行选择和确认。本发明利用AR/MR更加方面、更加清晰的显示语音识别的多个候选结果,不会影响智能手持设备本身的应用界面;通过语音识别功能界面进行触摸滑动,可以更加方便直观的选择候选结果,提高了操作便捷性,可以实现手不离设备的操作和单手操作。

    一种AR/MR设备语音识别的方法和装置及系统

    公开(公告)号:CN112735393B

    公开(公告)日:2023-11-24

    申请号:CN202011587781.0

    申请日:2020-12-29

    发明人: 黄石磊 刘轶 王昕

    摘要: 本发明公开了一种AR/MR设备语音识别的方法和装置及系统。所述方法包括:在AR/MR设备的虚拟视场中显示一投射屏幕和一虚拟屏幕,投射屏幕是将智能手持设备的显示屏幕投射到虚拟视场中形成的;在智能手持设备的显示屏幕上显示一语音识别功能界面;根据用户在智能手持设备语音识别功能界面的操作,进行语音录入和语音识别,将识别出的多个候选结果显示在虚拟屏幕上,对多个候选结果进行选择和确认。本发明利用AR/MR更加方面、更加清晰的显示语音识别的多个候选结果,不会影响智能手持设备本身的应用界面;通过语音识别功能界面进行触摸滑动,可以更加方便直观的选择候选结果,提高了操作便捷性,可以实现手不离设备的操作和单手操作。

    音频溯源方法、装置、设备及存储介质

    公开(公告)号:CN113162697A

    公开(公告)日:2021-07-23

    申请号:CN202110374262.4

    申请日:2021-04-07

    IPC分类号: H04B11/00 H04L29/06

    摘要: 本申请涉及音频处理技术领域,揭露了一种音频溯源方法,包括:在第一音频设备中,将第一音频设备的设备信息进行数字编码及调制操作,得到第一音频信号;利用所述第一音频设备按照预设频段播放所述第一音频信号,并采集含有所述第一音频信号和环境音频信号的第二音频信号,并将所述第二音频信号传输至第二音频设备中;在第二音频设备中,提取所述第二音频信号,并对所述第二音频信号进行信息提取,得到所述第一音频信号,对所述第一音频信号进行解调及数据解码,得到所述第一音频设备的设备信息。此外,本申请还涉及一种音频溯源装置、设备及存储介质。本申请可解决对音频来源的识别真实性较低的问题。

    智能问答系统和方法及相关设备

    公开(公告)号:CN112579666B

    公开(公告)日:2024-07-30

    申请号:CN202011476684.4

    申请日:2020-12-15

    发明人: 张剑 黄石磊 刘轶

    摘要: 本发明公开了一种智能问答系统和方法及相关设备。系统包括:问题分析子系统,用于生成问题描述文本,识别问题类型,即事实型、是非型、定义型;知识库生成子系统,用于将事实型、是非型的知识数据,整理成实体四元组,形成知识条;将定义型的知识数据,整理成问题答案配对形式并结合文本特征向量,形成知识条;答案抽取及生成子系统,用于对事实型、是非型的问题,分析得出实体四元组,进行检索匹配得到答案;对定义型的问题,进行向量化处理和特征向量相似度计算得到答案。本发明通过进行问题分类,分别利用数据库查询和特征向量相似度计算进行匹配,回答问题更加准确;知识内容库采用结构化的知识条形式,可减少储存量,检索效率更高更方便。

    智能问答系统和方法及相关设备

    公开(公告)号:CN112579666A

    公开(公告)日:2021-03-30

    申请号:CN202011476684.4

    申请日:2020-12-15

    发明人: 张剑 黄石磊 刘轶

    摘要: 本发明公开了一种智能问答系统和方法及相关设备。系统包括:问题分析子系统,用于生成问题描述文本,识别问题类型,即事实型、是非型、定义型;知识库生成子系统,用于将事实型、是非型的知识数据,整理成实体四元组,形成知识条;将定义型的知识数据,整理成问题答案配对形式并结合文本特征向量,形成知识条;答案抽取及生成子系统,用于对事实型、是非型的问题,分析得出实体四元组,进行检索匹配得到答案;对定义型的问题,进行向量化处理和特征向量相似度计算得到答案。本发明通过进行问题分类,分别利用数据库查询和特征向量相似度计算进行匹配,回答问题更加准确;知识内容库采用结构化的知识条形式,可减少储存量,检索效率更高更方便。

    说话人分离方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN114121023A

    公开(公告)日:2022-03-01

    申请号:CN202111446569.7

    申请日:2021-11-30

    发明人: 刘轶 黄石磊 程刚

    IPC分类号: G10L17/04

    摘要: 本申请涉及一种说话人分离方法,所述方法包括:获取待分离的语音信息,对待分离的语音信息进行初步分割,得到分离结果;对分离结果进行语音识别,得到分离语音内容,提取分离语音内容中的说话人转变点;提取分离结果的声纹特征和语义特征,并根据声纹特征和语义特征对分离结果进行说话人分类,得到标准分类结果;基于说话人转变点和标准分类结果对待分离的语音信息进行分类,得到目标分离结果。此外,本申请还涉及一种说话人分离方法、装置、设备及存储介质。本申请可解决说话人分离的准确度不够高的问题。