基于声纹增强和对抗的语音识别模型训练方法及装置

    公开(公告)号:CN116741180B

    公开(公告)日:2023-10-31

    申请号:CN202311013449.7

    申请日:2023-08-14

    发明人: 张明 杜文强

    摘要: 本发明公开了一种基于声纹增强和对抗的语音识别模型训练方法及装置,包括:获取待训练的语音样本以及样本标签;对每个语音样本,添加说话人标识符;其中,所述说话人标识符用于标识该语音样本的作用类别;其中,所述作用类别至少包括正向增强类别、负向减弱类别以及不处理类别;基于所述说话人标识符、所述语音样本以及所述样本标签,对待训练的神经网络模型进行迭代训练,得到训练完成的语音识别模型;可见,本发明能够实现一个语音识别模型来增强或弱化特定说话人的语音识别性能。

    基于音频情感的辅助审判方法、装置、设备及存储介质

    公开(公告)号:CN116758947A

    公开(公告)日:2023-09-15

    申请号:CN202311013453.3

    申请日:2023-08-14

    发明人: 王敏

    摘要: 本发明涉及音频检测领域,公开了一种基于音频情感的辅助审判方法、装置、设备及存储介质。该方法包括:获取线上法庭中待审判案件的庭审音频数据和庭审辅助信息,并按照待审判案件中各方审判人员,对庭审音频数据进行音频分类;提取分类结果中各方审判人员的多种频谱特征,并计算出各频谱特征对应的庭审情感值;利用预设庭审情感模型匹配各庭审情感值对应的情感特征,生成各方审判人员对应庭审音频片段的庭审情感标签;基于庭审情感标签,检测庭审辅助信息中对应审判人员的辩护真实性,得到检测结果,并基于检测结果和庭审辅助信息,生成待审判案件的辅助审判结果。本申请提高了线上庭审案件中基于音频情感状态分析的辅助审判结果的准确率。

    一种辅助审判方法、装置、设备及存储介质

    公开(公告)号:CN116596709A

    公开(公告)日:2023-08-15

    申请号:CN202310886908.6

    申请日:2023-07-19

    发明人: 王敏

    摘要: 本发明涉及音频检测领域,公开了一种基于庭审音频的辅助审判方法、装置、设备及存储介质。该方法包括:获取待审判案件的庭审录音数据、案件庭审类型和庭审辩护数据,并按照预设分段参数,对庭审录音数据进行频谱变换,得到多帧录音频谱片段;提取各录音频谱片段对应的频谱特征向量,并基于案件庭审类型,对各频谱特征向量进行庭审角色的归属聚类,得到聚类结果;对聚类结果进行各庭审角色的庭审特征提取,得到庭审特征,并基于庭审特征,构建待审判案件的录音逻辑数据;基于庭审辩护数据和录音逻辑数据,匹配待审判案件的法规特征,生成辅助审判结果。本申请提高了线上法庭对庭审录音数据中提取相关特征的准确率,以生成更准确的审判结果。

    基于iBeacon的信息推送方法及相关设备和系统

    公开(公告)号:CN112256353A

    公开(公告)日:2021-01-22

    申请号:CN202011205149.5

    申请日:2020-11-02

    发明人: 张明 关磊

    摘要: 本申请涉及一种基于iBeacon的信息推送方法及相关设备和系统。其中,相关设备包括智能手机和外部设备,由智能手机执行的方法包括:当监听到iBeacon广播信号时,判断iBeacon广播信号是否对应于已预先注册的外部设备;若判断结果为是,与外部设备建立BLE连接;其中,已建立BLE连接的外部设备能够发送唤醒请求,以唤醒智能手机上对应的应用;在应用处于唤醒状态下,接收云端服务器发送的推送信息。如此,由于设置了外部设备来唤醒智能手机上的用于接收推送信息的应用,因此,可以解决相关技术中无法及时向用户手机推送信息的问题。

    具有拾音功能的移动热点设备
    5.
    发明公开

    公开(公告)号:CN110324917A

    公开(公告)日:2019-10-11

    申请号:CN201910589823.5

    申请日:2019-07-02

    发明人: 张明 关磊

    IPC分类号: H04W88/08 H04R3/04 H04R3/00

    摘要: 本发明公开了一种具有拾音功能的移动热点设备,该移动热点设备包括,热点模块,其用于与外部智能设备建立第一通信链路;射频模块,其用于通过移动通信网络与远端服务器建立第二通信链路;拾音模块,其用于采集设备所处环境的声音信号;控制模块,其用于接收外部智能设备通过第一通信链路发送的拾音请求,根据拾音请求控制拾音模块工作,将拾音模块采集到的初始声音数据通过第二通信链路发送给远端服务器,接收远端服务器返回的处理后的声音数据并转发给外部智能设备。该移动热点设备可以满足用户在特定的嘈杂环境下获得有效声音信息的需求。

    基于庭审音频的关联度挖掘方法、装置、设备及存储介质

    公开(公告)号:CN116756324B

    公开(公告)日:2023-10-27

    申请号:CN202311013900.5

    申请日:2023-08-14

    发明人: 王敏

    摘要: 本发明涉及音频检测领域,公开了一种基于庭审音频的关联度挖掘方法、装置、设备及存储介质。该方法包括:获取待审判案件的庭审音频数据,并基于待审判案件中各方审判人员,对庭审音频数据进行音源清洗和音频分离,得到音频分离结果;提取音频分离结果中各方审判人员的多个案件陈述特征,并基于案件陈述特征,对各方审判人员进行多维庭审文本类型的分析,得到多维庭审文本标识;确定庭审文本标识中各方审判人员对应的至少一个陈述主题,并基于陈述主题,构建各庭审文本标识之间的陈述关联度,生成庭审音频的关联度挖掘结果。本申请实现了对线上法庭中相关庭审音频数据之间关联度的挖掘,提高了最终生成的辅助审判结果的准确性。

    基于庭审音频的关联度挖掘方法、装置、设备及存储介质

    公开(公告)号:CN116756324A

    公开(公告)日:2023-09-15

    申请号:CN202311013900.5

    申请日:2023-08-14

    发明人: 王敏

    摘要: 本发明涉及音频检测领域,公开了一种基于庭审音频的关联度挖掘方法、装置、设备及存储介质。该方法包括:获取待审判案件的庭审音频数据,并基于待审判案件中各方审判人员,对庭审音频数据进行音源清洗和音频分离,得到音频分离结果;提取音频分离结果中各方审判人员的多个案件陈述特征,并基于案件陈述特征,对各方审判人员进行多维庭审文本类型的分析,得到多维庭审文本标识;确定庭审文本标识中各方审判人员对应的至少一个陈述主题,并基于陈述主题,构建各庭审文本标识之间的陈述关联度,生成庭审音频的关联度挖掘结果。本申请实现了对线上法庭中相关庭审音频数据之间关联度的挖掘,提高了最终生成的辅助审判结果的准确性。

    语音翻译方法、装置及设备、翻译机

    公开(公告)号:CN112309370A

    公开(公告)日:2021-02-02

    申请号:CN202011205126.4

    申请日:2020-11-02

    发明人: 张明 关磊

    摘要: 本申请涉及一种语音翻译方法、装置及设备、翻译机,语音翻译方法包括:获取语音信息,通过语音信息确定说话人的声纹特征;通过说话人的声纹特征判断说话人是否是第一用户;若说话人是第一用户,确定第一用户的第一语言,基于第一语言识别语音信息,基于预先设置的第二语言,将识别后的信息转换成第二语言的信息;若说话人不是第一用户,确定预先设置的第二语言,基于第二语言识别语音信息,基于第一用户的第一语言,将识别后的信息转换成第一语言的信息。如此,无需建立语种识别模型,通过声纹识别即可解决多语种间的双语种识别问题以及双语种间的自动语音翻译选择问题,降低了翻译训练复杂度,有效提高了翻译效率。

    防误触方法、装置和翻译机

    公开(公告)号:CN109002438A

    公开(公告)日:2018-12-14

    申请号:CN201810712429.1

    申请日:2018-07-02

    发明人: 关磊 张明

    IPC分类号: G06F17/28 G06F21/83

    摘要: 本申请涉及一种防误触方法、装置和翻译机,所述方法包括:判断所述翻译机是否已启动翻译模式;若所述翻译机已启动翻译模式,锁定所述翻译机的外围功能按键,使所述翻译机的外围功能按键失效,所述外围功能按键包括:音量键、个人热点键、菜单键、设定功能键和/或电源键。通过该方法能够较为有效地降低误触发生概率,可以有效避免用户使用翻译机时由于误触操作对翻译工作产生干扰,从而能够更好地保障翻译机翻译工作的有效执行,能够提升用户使用体验。

    在线离线同时翻译装置
    10.
    发明公开

    公开(公告)号:CN108763232A

    公开(公告)日:2018-11-06

    申请号:CN201810712430.4

    申请日:2018-07-02

    发明人: 关磊 张明

    IPC分类号: G06F17/28 H04L29/08

    CPC分类号: G06F17/289 H04L67/06

    摘要: 本发明涉及一种翻译装置,特别是一种能够实现在线翻译和离线翻译同时进行,保证翻译流畅的在线离线同时翻译装置。它包括CPU、语音模块、显示模块、翻译处理模块、网络模块以及云服务器,所述的CPU分别与所述的语音模块、翻译处理模块以及网络模块连接,所述的网络模块与所述的云服务器网络连接。本发明的在线离线同时翻译装置,通过CPU、语音模块、网络模块、云服务器、翻译处理模块以及显示模块等的配合,能够实现在线翻译和离线翻译同时进行,当翻译处理模块进行翻译的时候,若遇到新的词汇、语句等无法翻译的时候,网络模块连接上云服务器从网上导入翻译信息,保证了翻译的流畅性。