-
公开(公告)号:CN112735393A
公开(公告)日:2021-04-30
申请号:CN202011587781.0
申请日:2020-12-29
IPC分类号: G10L15/16 , G10L15/22 , G10L15/26 , G10L15/28 , G06F3/0488
摘要: 本发明公开了一种AR/MR设备语音识别的方法和装置及系统。所述方法包括:在AR/MR设备的虚拟视场中显示一投射屏幕和一虚拟屏幕,投射屏幕是将智能手持设备的显示屏幕投射到虚拟视场中形成的;在智能手持设备的显示屏幕上显示一语音识别功能界面;根据用户在智能手持设备语音识别功能界面的操作,进行语音录入和语音识别,将识别出的多个候选结果显示在虚拟屏幕上,对多个候选结果进行选择和确认。本发明利用AR/MR更加方面、更加清晰的显示语音识别的多个候选结果,不会影响智能手持设备本身的应用界面;通过语音识别功能界面进行触摸滑动,可以更加方便直观的选择候选结果,提高了操作便捷性,可以实现手不离设备的操作和单手操作。
-
公开(公告)号:CN112634878B
公开(公告)日:2024-05-17
申请号:CN202011476615.3
申请日:2020-12-15
IPC分类号: G10L15/06 , G10L15/183 , G10L15/19 , G10L15/22
摘要: 本发明公开了一种语音识别后处理方法和系统及相关设备。所述方法包括:从语音识别系统针对输入语音进行第一次解码产生的词图lattice中,提取前N个最好的识别结果N‑best lists;使用训练好的带有词性的BERT双向语言模型对N‑best lists进行重打分;从N‑best lists中选择得分最高的结果作为最终的识别结果。本发明对N‑best lists进行重打分时,通过使用带有词性的BERT双向语言模型,能够同时利用上下文信息,还可以利用到上下文的词性信息,从而可以进一步提升语音识别系统的性能。
-
公开(公告)号:CN112735393B
公开(公告)日:2023-11-24
申请号:CN202011587781.0
申请日:2020-12-29
IPC分类号: G10L15/16 , G10L15/22 , G10L15/26 , G10L15/28 , G06F3/0488
摘要: 本发明公开了一种AR/MR设备语音识别的方法和装置及系统。所述方法包括:在AR/MR设备的虚拟视场中显示一投射屏幕和一虚拟屏幕,投射屏幕是将智能手持设备的显示屏幕投射到虚拟视场中形成的;在智能手持设备的显示屏幕上显示一语音识别功能界面;根据用户在智能手持设备语音识别功能界面的操作,进行语音录入和语音识别,将识别出的多个候选结果显示在虚拟屏幕上,对多个候选结果进行选择和确认。本发明利用AR/MR更加方面、更加清晰的显示语音识别的多个候选结果,不会影响智能手持设备本身的应用界面;通过语音识别功能界面进行触摸滑动,可以更加方便直观的选择候选结果,提高了操作便捷性,可以实现手不离设备的操作和单手操作。
-
公开(公告)号:CN113162697A
公开(公告)日:2021-07-23
申请号:CN202110374262.4
申请日:2021-04-07
摘要: 本申请涉及音频处理技术领域,揭露了一种音频溯源方法,包括:在第一音频设备中,将第一音频设备的设备信息进行数字编码及调制操作,得到第一音频信号;利用所述第一音频设备按照预设频段播放所述第一音频信号,并采集含有所述第一音频信号和环境音频信号的第二音频信号,并将所述第二音频信号传输至第二音频设备中;在第二音频设备中,提取所述第二音频信号,并对所述第二音频信号进行信息提取,得到所述第一音频信号,对所述第一音频信号进行解调及数据解码,得到所述第一音频设备的设备信息。此外,本申请还涉及一种音频溯源装置、设备及存储介质。本申请可解决对音频来源的识别真实性较低的问题。
-
公开(公告)号:CN112579666B
公开(公告)日:2024-07-30
申请号:CN202011476684.4
申请日:2020-12-15
IPC分类号: G06F16/2458 , G06F16/332 , G06F16/35
摘要: 本发明公开了一种智能问答系统和方法及相关设备。系统包括:问题分析子系统,用于生成问题描述文本,识别问题类型,即事实型、是非型、定义型;知识库生成子系统,用于将事实型、是非型的知识数据,整理成实体四元组,形成知识条;将定义型的知识数据,整理成问题答案配对形式并结合文本特征向量,形成知识条;答案抽取及生成子系统,用于对事实型、是非型的问题,分析得出实体四元组,进行检索匹配得到答案;对定义型的问题,进行向量化处理和特征向量相似度计算得到答案。本发明通过进行问题分类,分别利用数据库查询和特征向量相似度计算进行匹配,回答问题更加准确;知识内容库采用结构化的知识条形式,可减少储存量,检索效率更高更方便。
-
公开(公告)号:CN113128228A
公开(公告)日:2021-07-16
申请号:CN202110373594.0
申请日:2021-04-07
IPC分类号: G06F40/295 , G06F16/335 , G06F40/205 , G06F40/284 , G10L15/10 , G10L15/18 , G10L15/22 , G10L15/26
摘要: 本申请涉及人工智能领域,揭露一种语音指令识别方法,包括:对用户语音指令进行文本转化及分词处理,得到文本关键词,将所述文本关键词与预设匹配库中的词组进行匹配,所述匹配库包括基于用户文本数据提取的用户字段和对应的词组,从所述匹配库中获取所匹配到的词组对应的用户字段,并判断所获取到的用户字段是否唯一,若是,则根据所述用户语音指令和所获取到的用户字段生成对应的操作指令,若否,则显示所匹配到的词组以供用户选择,并根据所述用户语音指令和用户选择的词组所对应的用户字段,生成对应的操作指令。本申请还揭露一种语音指令识别装置、电子设备及存储介质。本申请可以提高语音指令识别的准确率,提高用户体验。
-
公开(公告)号:CN112634878A
公开(公告)日:2021-04-09
申请号:CN202011476615.3
申请日:2020-12-15
IPC分类号: G10L15/06 , G10L15/183 , G10L15/19 , G10L15/22
摘要: 本发明公开了一种语音识别后处理方法和系统及相关设备。所述方法包括:从语音识别系统针对输入语音进行第一次解码产生的词图lattice中,提取前N个最好的识别结果N‑best lists;使用训练好的带有词性的BERT双向语言模型对N‑best lists进行重打分;从N‑best lists中选择得分最高的结果作为最终的识别结果。本发明对N‑best lists进行重打分时,通过使用带有词性的BERT双向语言模型,能够同时利用上下文信息,还可以利用到上下文的词性信息,从而可以进一步提升语音识别系统的性能。
-
公开(公告)号:CN112579666A
公开(公告)日:2021-03-30
申请号:CN202011476684.4
申请日:2020-12-15
IPC分类号: G06F16/2458 , G06F16/332 , G06F16/35
摘要: 本发明公开了一种智能问答系统和方法及相关设备。系统包括:问题分析子系统,用于生成问题描述文本,识别问题类型,即事实型、是非型、定义型;知识库生成子系统,用于将事实型、是非型的知识数据,整理成实体四元组,形成知识条;将定义型的知识数据,整理成问题答案配对形式并结合文本特征向量,形成知识条;答案抽取及生成子系统,用于对事实型、是非型的问题,分析得出实体四元组,进行检索匹配得到答案;对定义型的问题,进行向量化处理和特征向量相似度计算得到答案。本发明通过进行问题分类,分别利用数据库查询和特征向量相似度计算进行匹配,回答问题更加准确;知识内容库采用结构化的知识条形式,可减少储存量,检索效率更高更方便。
-
公开(公告)号:CN114121023A
公开(公告)日:2022-03-01
申请号:CN202111446569.7
申请日:2021-11-30
IPC分类号: G10L17/04
摘要: 本申请涉及一种说话人分离方法,所述方法包括:获取待分离的语音信息,对待分离的语音信息进行初步分割,得到分离结果;对分离结果进行语音识别,得到分离语音内容,提取分离语音内容中的说话人转变点;提取分离结果的声纹特征和语义特征,并根据声纹特征和语义特征对分离结果进行说话人分类,得到标准分类结果;基于说话人转变点和标准分类结果对待分离的语音信息进行分类,得到目标分离结果。此外,本申请还涉及一种说话人分离方法、装置、设备及存储介质。本申请可解决说话人分离的准确度不够高的问题。
-
公开(公告)号:CN107808011A
公开(公告)日:2018-03-16
申请号:CN201711155288.X
申请日:2017-11-20
CPC分类号: G06F17/30705 , G06K9/6269
摘要: 本申请涉及一种信息的分类抽取方法、装置、计算机设备和存储介质,所述方法包括:获取公告信息,利用所述公告信息生成多个文本块;获取分类器,利用所述分类器对多个文本块进行分类,对分类后的文本块添加类别标签;根据所述类别标签对分类后的文本块进行分割,得到多个分割块;对多个类别标签对应的分割块进行筛选;计算与类别标签对应的筛选出的分割块之间的相关性,根据所述相关性对筛选出的分割块进行抽取;利用抽取到的分割块组成抽取结果信息。采用本方法能够提高信息抽取的效率。
-
-
-
-
-
-
-
-
-