-
公开(公告)号:CN109524017A
公开(公告)日:2019-03-26
申请号:CN201811424175.X
申请日:2018-11-27
申请人: 北京分音塔科技有限公司 , 清华大学
摘要: 本发明涉及一种用户自定义词的语音识别增强方法和装置,所述方法包括:获取用户自定义词;将用户自定义词拆分为已有词语的组合;将用户自定义词拆分后的已有词语组合生成用户自定义词典FST图;将用户自定义词典FST图和原有的解码图进行合并处理,得到合并后的解码图;利用合并后的解码图对用户输入的语音进行语音识别处理。本发明所述方法通过将用户自定义词FST图和原有的HCLG解码图合并,完成了对用户自定义词的权重增强,从而提高了对用户自定义词的识别效果;并且本方法充分利用了语音识别中解码图的信息,并在语音识别过程中充分结合了声学模型和语言模型的信息进行路径搜索,从而增强了对用户自定义词的识别准确率。
-
公开(公告)号:CN109377985B
公开(公告)日:2022-03-18
申请号:CN201811424174.5
申请日:2018-11-27
申请人: 北京分音塔科技有限公司 , 清华大学
IPC分类号: G10L15/10 , G10L15/06 , G10L15/197 , G10L15/26
摘要: 本发明涉及一种领域词的语音识别增强方法和装置,所述方法包括:通过收集的文本语料数据,训练生成第一语言模型;将所述第一语言模型转换为第一解码图;获取所述领域词与所述文本语料数据的相似度;通过所述第一解码图和所述相似度,计算出与所述领域词相对应的第二语言模型;根据所述第二语言模块对所述第一解码图进行扩展,得到包含所述领域词信息的第二解码图;利用所述第二解码图对用户输入的语音进行语音识别处理。本发明所述的方法处理过程简单,通过对领域词权重增强和扩展,提高了对未出现的领域词和信息较少领域词在语音识别中的识别准确率,有利于提高用户体验,也有利于语音识别在更多领域的应用。
-
公开(公告)号:CN109377985A
公开(公告)日:2019-02-22
申请号:CN201811424174.5
申请日:2018-11-27
申请人: 北京分音塔科技有限公司 , 清华大学
IPC分类号: G10L15/10 , G10L15/06 , G10L15/197 , G10L15/26
摘要: 本发明涉及一种领域词的语音识别增强方法和装置,所述方法包括:通过收集的文本语料数据,训练生成第一语言模型;将所述第一语言模型转换为第一解码图;获取所述领域词与所述文本语料数据的相似度;通过所述第一解码图和所述相似度,计算出与所述领域词相对应的第二语言模型;根据所述第二语言模块对所述第一解码图进行扩展,得到包含所述领域词信息的第二解码图;利用所述第二解码图对用户输入的语音进行语音识别处理。本发明所述的方法处理过程简单,通过对领域词权重增强和扩展,提高了对未出现的领域词和信息较少领域词在语音识别中的识别准确率,有利于提高用户体验,也有利于语音识别在更多领域的应用。
-
公开(公告)号:CN112256353A
公开(公告)日:2021-01-22
申请号:CN202011205149.5
申请日:2020-11-02
申请人: 北京分音塔科技有限公司
IPC分类号: G06F9/445 , G06F16/9535 , G06F16/9537 , H04W4/80 , H04W4/06 , H04W76/14 , H04M1/72484 , H04L29/08
摘要: 本申请涉及一种基于iBeacon的信息推送方法及相关设备和系统。其中,相关设备包括智能手机和外部设备,由智能手机执行的方法包括:当监听到iBeacon广播信号时,判断iBeacon广播信号是否对应于已预先注册的外部设备;若判断结果为是,与外部设备建立BLE连接;其中,已建立BLE连接的外部设备能够发送唤醒请求,以唤醒智能手机上对应的应用;在应用处于唤醒状态下,接收云端服务器发送的推送信息。如此,由于设置了外部设备来唤醒智能手机上的用于接收推送信息的应用,因此,可以解决相关技术中无法及时向用户手机推送信息的问题。
-
公开(公告)号:CN110324917A
公开(公告)日:2019-10-11
申请号:CN201910589823.5
申请日:2019-07-02
申请人: 北京分音塔科技有限公司
摘要: 本发明公开了一种具有拾音功能的移动热点设备,该移动热点设备包括,热点模块,其用于与外部智能设备建立第一通信链路;射频模块,其用于通过移动通信网络与远端服务器建立第二通信链路;拾音模块,其用于采集设备所处环境的声音信号;控制模块,其用于接收外部智能设备通过第一通信链路发送的拾音请求,根据拾音请求控制拾音模块工作,将拾音模块采集到的初始声音数据通过第二通信链路发送给远端服务器,接收远端服务器返回的处理后的声音数据并转发给外部智能设备。该移动热点设备可以满足用户在特定的嘈杂环境下获得有效声音信息的需求。
-
公开(公告)号:CN112201224A
公开(公告)日:2021-01-08
申请号:CN202011073402.6
申请日:2020-10-09
申请人: 北京分音塔科技有限公司
IPC分类号: G10L15/00 , G10L17/06 , G10L13/033 , G06F40/58
摘要: 本申请涉及一种用于即时通话同声翻译的方法、设备及系统,本申请中,在接收发送端发送的待处理数据后,由于待处理数据可能是音频数据,也可能是视频数据,所以需要对待处理数据进行预处理,得到待处理数据中的音频数据。对音频数据进行语种识别,并匹配对应的语言翻译模块进行翻译,本申请中,通过对音频数据进行性别识别和声纹分析,生成与音频数据性别和声纹匹配的模拟声音,通过模拟声音来模拟讲话者的声音向接收端发送语言翻译模块翻译后的音频数据,使收听者既能清楚明白的了解通话内容,也能对讲话者的声音和性别有一定的了解。
-
公开(公告)号:CN110213388A
公开(公告)日:2019-09-06
申请号:CN201910589381.4
申请日:2019-07-02
申请人: 北京分音塔科技有限公司
摘要: 本发明公开了一种具有旅游信息推送功能的移动热点设备,其包括,热点模块,其用于与外部智能设备建立第一通信链路;射频模块,其用于通过移动通信网络与远端服务器建立第二通信链路;定位模块,其用于提供设备的实时地理位置信息;控制模块,其用于接收外部智能设备通过第一通信链路发送的信息推送请求,将所述信息推送请求和实时地理位置信息通过第二通信链路发送给远端服务器,接收远端服务器返回的推送数据并转发给外部智能设备,其中,推送数据包括与实时地理位置相关的旅游信息。该移动热点设备能为在外旅游的人提供便利。
-
公开(公告)号:CN108710617A
公开(公告)日:2018-10-26
申请号:CN201810712486.X
申请日:2018-07-02
申请人: 北京分音塔科技有限公司
CPC分类号: G06F17/289 , G10L15/005 , G10L15/22 , G10L2015/223
摘要: 本发明涉及一种智能翻译机及其工作方法,电源模块、输入模块、多语言翻译模块、导航定位模块、输出模块以及微处理器,输入模块、多语言翻译模块、导航定位模块、输出模块分别与微处理器连接;输入模块用于接收用户的指令信息;多语言翻译模块用于识别语音信息的语种并翻译成预先设置的目标语种;导航定位模块用于获取景区的位置并提供导航路线;微处理器用于接收指令信息,并根据指令信息获取对应的提示信息;输出模块用于输出提示信息;本发明能够实现既有翻译功能又有景区导航功能的翻译机,减少用户出门旅游时携带设备的数量,提高用户便利性。
-
公开(公告)号:CN108647215A
公开(公告)日:2018-10-12
申请号:CN201810721280.3
申请日:2018-07-02
申请人: 北京分音塔科技有限公司
摘要: 本发明涉及一种多功能翻译机,包括:翻译机本体;翻译机本体内部设有电路控制板,电路控制板上设有:语音输入模块、翻译模块、语音播报模块、WIFI热点模块和微处理器,翻译模块、语音播报模块、WIFI热点模块分别与微处理器连接;语音输入模块用于采集用户的语音信息;翻译模块用于识别语音信息并翻译成预先设置的目标语种音频信息;WIFI热点模块用于向其他智能设备提供无线接入点;本发明提供的翻译机设有翻译模块和WIFI热点模块,使得翻译机将翻译功能和WIFI热点功能集合在一起,功能多样,并且占用空间小,实用性强。
-
公开(公告)号:CN107993646A
公开(公告)日:2018-05-04
申请号:CN201610941340.3
申请日:2016-10-25
申请人: 北京分音塔科技有限公司
CPC分类号: G10L15/26 , G06F17/289 , G10L13/02
摘要: 本发明公开了一种实现实时语音互译的方法,包括:通过对讲装置获取语音信号,转化为语音数据;将语音数据发送给移动通信设备;将语音数据经语音识别处理后转换为语句文字,将语句文字翻译成目标语种的文本;将目标语种的文本进行语音合成处理,生成可播放的语音数据在移动通信设备播放;通过移动通信设备获取语音信号,转换为语音数据经语音识别处理后转换为语句文字,将语句文字翻译成目标语种的文本;将目标语种的文本进行语音合成处理,生成可播放的语音数据并发送给对讲装置播放。利用本发明提供的方法,可将一种语言语音实时翻译成另一种语言的语音信号,便于不同语言的人员之间的双向沟通交流。
-
-
-
-
-
-
-
-
-