基于区分性互补信息的语音客观评价最优特征组筛选方法

    公开(公告)号:CN112767968A

    公开(公告)日:2021-05-07

    申请号:CN202011425818.X

    申请日:2020-12-09

    IPC分类号: G10L25/60 G10L19/02

    摘要: 本发明公开了一种基于区分性互补信息的语音客观评价最优特征组筛选方法,包括先提取语音样本的多种特征来构成样本特征集;计算特征集的互补信息熵和单一特征的区分性;根据特征集中单一特征与主观评分的相关性,以及单一特征的区分性,选择第一个使二者之和最大的特征;根据候选特征集中单一特征与主观评分的相关性,以及候选特征集的互补信息熵,选择其他使二者之和最大的特征;最后采用皮尔逊相系数作为语音客观质量评价指标,根据岭回归模型的性能提升指数判断最优特征组是否收敛。本发明解决了单一特征难以实现理想的语音客观评价,多特征组合容易造成模型过拟合、计算复杂度高的问题,有效选择出实现语音客观质量评价的最佳特征组合。

    一种用于实时语音识别的话筒及系统

    公开(公告)号:CN107071603A

    公开(公告)日:2017-08-18

    申请号:CN201710519178.0

    申请日:2017-06-30

    发明人: 余克佳 石城川

    摘要: 本发明提供一种用于实时语音识别的话筒及系统,包括话筒外壳、设置在话筒内部的智能装置及运行在移动终端上面的软件。该智能装置包括语音输入模块、蓝牙模块和电源模块;语音输入模块收集语音信号,蓝牙模块将语音信号传输给移动终端上面的软件,软件进行语音识别,将识别之后的文字信息实时显示在移动终端的显示屏上面。健听人拿着话筒说话,听障人拿着移动终端并打开相应软件,由此,听障人可以实时看到健听人讲话的内容,提高了沟通效率。

    一种语音识别系统中基于多个卷积神经网络的语音增强算法

    公开(公告)号:CN108172238B

    公开(公告)日:2021-08-13

    申请号:CN201810012748.1

    申请日:2018-01-06

    IPC分类号: G10L21/0264 G10L25/30

    摘要: 本发明涉及一种基于CNN的噪声识别以及一种结合CNN与平稳快速递归最小二乘法(SFTRLS)的语音增强模型‑‑SFTRLS‑CNN。首先提取带噪音频段中噪声的MFCC等648维特征,进入训练好的第一种卷积神经网络中来识别出噪声的环境类型。然后将提取的音频特征、信噪比和噪声类型值组成658维度特征,采用第二种卷积神经网络来自适应地匹配到SFTRLS算法进行语音增强的最佳遗忘因子。最后通过平稳快速递归最小二乘法实现在各个环境下的降噪处理。该算法让增强模型适用于不同的噪声环境,提高了自适应能力。相比传统的SFTRLS,语音质量评价指标值也更佳。

    一种用于实时语音识别的录音笔及系统

    公开(公告)号:CN107123425A

    公开(公告)日:2017-09-01

    申请号:CN201710528586.2

    申请日:2017-07-01

    发明人: 莫小慧 石城川

    IPC分类号: G10L15/30 G10L21/0216

    摘要: 本发明提供一种用于实时语音识别的录音笔及系统,包括录音笔外壳、设置在录音笔内部的智能装置及运行在移动终端上面的软件。该智能装置包括语音输入模块、蓝牙模块和电源模块;语音输入模块收集语音信号,蓝牙模块将语音信号传输给移动终端上面的软件,软件进行语音识别,将识别之后的文字信息实时显示在移动终端的显示屏上面。健听人拿着录音笔说话,听障人拿着移动终端并打开相应软件,由此,听障人可以实时看到健听人讲话的内容,提高了沟通效率。

    用于远场拾音及移动充电的音频处理装置及系统

    公开(公告)号:CN106611600A

    公开(公告)日:2017-05-03

    申请号:CN201611096284.4

    申请日:2016-12-02

    发明人: 石城川 余克佳

    摘要: 本发明提供一种用于远场拾音和移动充电的音频处理装置及系统,其包括蓝牙模块、中央处理器、唤醒模块、语音输入模块、电源模块、手机、APP应用和显示屏。所述电源模块用于给所述装置供电,所述唤醒模块唤醒所述语音输入模块,所述语音输入模块采集外界的声音信息,所述中央处理器对所述声音信息进行降噪、去混响、回声消除、语音增强等处理,所述蓝牙模块将所述处理后的音频信息发送给所述手机,所述手机APP对所述音频信息进行语音识别并发送唤醒指令给所述唤醒模块,所述显示屏实时显示所述识别后的文字信息。本发明的用于语音听写的音频处理装置,以实现听障人通过手机屏幕显示的文本信息可清楚的知道对方说话内容,为听障人的沟通带来了方便。

    基于区分性互补信息的语音客观评价最优特征组筛选方法

    公开(公告)号:CN112767968B

    公开(公告)日:2022-09-16

    申请号:CN202011425818.X

    申请日:2020-12-09

    IPC分类号: G10L25/60 G10L19/02

    摘要: 本发明公开了一种基于区分性互补信息的语音客观评价最优特征组筛选方法,包括先提取语音样本的多种特征来构成样本特征集;计算特征集的互补信息熵和单一特征的区分性;根据特征集中单一特征与主观评分的相关性,以及单一特征的区分性,选择第一个使二者之和最大的特征;根据候选特征集中单一特征与主观评分的相关性,以及候选特征集的互补信息熵,选择其他使二者之和最大的特征;最后采用皮尔逊相系数作为语音客观质量评价指标,根据岭回归模型的性能提升指数判断最优特征组是否收敛。本发明解决了单一特征难以实现理想的语音客观评价,多特征组合容易造成模型过拟合、计算复杂度高的问题,有效选择出实现语音客观质量评价的最佳特征组合。

    基于便携式设备的无障碍字幕教学系统

    公开(公告)号:CN113450631A

    公开(公告)日:2021-09-28

    申请号:CN202110789236.8

    申请日:2021-07-13

    摘要: 本发明提供的基于便携式设备的无障碍字幕教学系统,包括声音采集模块、中央处理器、终端显示设备。声音采集模块通过便携式设备的麦克风采集环境声音信息得到实时音频,通过互联网将实时音频传输到中央处理器,语音识别模块将实时音频信息转换成对应的文本信息,文本信息通过互联网传输至终端显示设备,在终端显示设备的屏幕上呈现。本发明公开的基于便携式设备的无障碍字幕教学系统,利用便携式设备采集声音,增加了系统的实用性。老师可以在教学过程中展示的图片、幻灯片和视频等内容的同时,呈现实时语音字幕,随时修改已呈现的文字字幕,更便利、更多样化,有利于在教学过程中增强学生的理解,帮助提高学生的书面语和口语能力。

    一种实时显示的会议字幕系统
    8.
    发明公开

    公开(公告)号:CN109982010A

    公开(公告)日:2019-07-05

    申请号:CN201711444020.8

    申请日:2017-12-27

    摘要: 本发明提供一种实时显示的会议字幕系统,包括显示装置、音视频转接装置、移动终端和拾音装置。该拾音装置实时获取会议音频流,并通过转接装置传递给移动终端,移动终端进行语音识别,并将识别出来的文字信息处理为字幕页面,然后通过转接装置将字幕页面以视频流的形式传递给显示装置显示。听障人士出席装备了该实时显示的会议字幕系统的会议时,就不再需要专职的手语翻译员,也能够准确地理解会议内容,极大提升了听障人士的沟通效率。

    一种用于实时语音识别的音频线及系统

    公开(公告)号:CN108428454A

    公开(公告)日:2018-08-21

    申请号:CN201711449341.7

    申请日:2017-12-27

    IPC分类号: G10L15/26 H01R31/06 H01R13/66

    摘要: 本发明提供一种用于实时语音识别的音频线及系统,包括三段音频头、包含控制电路的连接线、四段音频头及运行在移动终端上面的软件。音频信号经该三段音频头的左声道输入,经由连接线传输后,由四段音频头的麦克风输出给移动终端上面的软件,软件进行语音识别,将识别之后的文字信息实时显示在移动终端的显示屏上面。听障人利用此音频线和移动终端,就可以给没有字幕的直播视频、教学视频、新闻视频等视频显示出实时字幕,提高了听障人士获取信息的效率。