一种基于深度学习的说话人聚类系统

    公开(公告)号:CN110211595A

    公开(公告)日:2019-09-06

    申请号:CN201910574851.X

    申请日:2019-06-28

    Inventor: 伍强

    Abstract: 本发明公开了一种基于深度学习的说话人聚类系统,包括:顺序相连的语音采集和存储模块、声学特征提取模块、说话人识别模块、帧级特征融合模块和说话人聚类模块,其中:语音采集和存储模块,用于采集和存储语音数据;声学特征提取模块,用于提取说话人语音的声学特征;说话人识别模块,用于提取说话人语音的帧级深度声纹特征;帧级特征融合模块,用于融合帧级深度声纹特征得到句级深度声纹特征;说话人聚类模块,用于输出说话人语音数据的标签信息。本发明提供的基于深度学习的说话人聚类系统大大减少人工参与数据标定的工作量,同时也有助于提高说话人识别模块的精度。

    一种信息处理方法及冰箱

    公开(公告)号:CN103791688B

    公开(公告)日:2017-05-24

    申请号:CN201410065458.5

    申请日:2014-02-25

    Abstract: 本发明涉及家用电器领域,公开了一种信息处理方法及冰箱,用于解决现有技术中冰箱不能对食品的相关信息进行更新的技术问题,该方法应用于冰箱,包括:获得存贮于冰箱的第一对象的第一参数信息;根据第一参数信息判断第一对象是否位于对象信息列表;在第一对象不位于对象列表时,将第一对象的相关信息更新至对象信息列表。

    一种信息输出方法、冰箱及服务器

    公开(公告)号:CN103793192B

    公开(公告)日:2017-01-25

    申请号:CN201410065027.9

    申请日:2014-02-25

    Abstract: 本发明公开了一种信息输出方法,用于增强冰箱的提示效果。所述方法包括:在第一时刻,确定所述冰箱内存放的M个对象,并将所述M个对象所对应的M个对象信息发送给服务器,以使所述服务器能够根据所述M个对象信息生成当前对象信息列表,将所述当前对象信息列表与预设对象信息列表进行比对,判断所述当前对象信息列表与所述预设对象信息列表是否相同,及当所述当前对象信息列表与所述预设对象信息列表不相同时,根据所述当前对象信息列表与所述预设对象信息列表中不相同的对象信息生成一更新对象信息列表;M为正整数;获得并输出所述服务器返回的所述更新对象信息列表。本发明还公开了相应的冰箱及服务器。

    一种基于深度学习的说话人聚类系统

    公开(公告)号:CN110211595B

    公开(公告)日:2021-08-06

    申请号:CN201910574851.X

    申请日:2019-06-28

    Inventor: 伍强

    Abstract: 本发明公开了一种基于深度学习的说话人聚类系统,包括:顺序相连的语音采集和存储模块、声学特征提取模块、说话人识别模块、帧级特征融合模块和说话人聚类模块,其中:语音采集和存储模块,用于采集和存储语音数据;声学特征提取模块,用于提取说话人语音的声学特征;说话人识别模块,用于提取说话人语音的帧级深度声纹特征;帧级特征融合模块,用于融合帧级深度声纹特征得到句级深度声纹特征;说话人聚类模块,用于输出说话人语音数据的标签信息。本发明提供的基于深度学习的说话人聚类系统大大减少人工参与数据标定的工作量,同时也有助于提高说话人识别模块的精度。

    一种基于迁移学习的设备异音检测方法及系统

    公开(公告)号:CN111998936A

    公开(公告)日:2020-11-27

    申请号:CN202010864239.9

    申请日:2020-08-25

    Inventor: 伍强 展华益

    Abstract: 本发明提供了一种基于迁移学习的设备异音检测方法及系统,所述方法包括从设备录音中的至少一段音频区域提取声学特征;使用源领域特征模型从声学特征中提取设备的声纹特征向量;使用目标领域分类模型分类设备的声纹特征向量,判断所述设备是否是异常设备。还公开了采用上述方法的系统。通过采用本发明提供的方法和系统,能够解决异常设备音频样本少甚至没有而导致的设备故障诊断系统鲁棒性差的问题,更好地实现了利用机器学习和人工智能技术来判断设备的运行状态。

    实时声纹辨识系统与方法

    公开(公告)号:CN108648760A

    公开(公告)日:2018-10-12

    申请号:CN201810343033.4

    申请日:2018-04-17

    Abstract: 本发明公开了一种实时声纹辨识系统与方法,包括:语音采集和存储模块,用于采集和存储语音数据;音素检测模块,用于检测所述语音数据中存在的音素类别和音素位置;说话人辨识模块,用于根据所述音素类别和音素位置确认说话人身份信息。本发明可以实现对与文本无关的说话人的别,提高了用户的体验度;采用音素作为语言中最基本的组成单元,具有更高可辨识性,同时将与文本无关的内容转化为文本相关,降低了对说话人识别的难度。

    一种信息输出方法及冰箱

    公开(公告)号:CN103823652B

    公开(公告)日:2017-10-27

    申请号:CN201410064344.9

    申请日:2014-02-25

    Abstract: 本发明公开了一种信息输出方法,用于增强冰箱的提示效果。所述方法包括:在第一时刻,确定所述冰箱内存放的M个对象,并根据所述M个对象所分别对应的对象信息生成当前对象信息列表;M为正整数;将所述当前对象信息列表与预设对象信息列表进行比对,判断所述当前对象信息列表与所述预设对象信息列表是否相同;当所述当前对象信息列表与所述预设对象信息列表不相同时,根据所述当前对象信息列表与所述预设对象信息列表中不相同的对象信息生成并输出一更新对象信息列表。本发明还公开了相应的冰箱。

    一种信息输出方法及冰箱
    10.
    发明公开

    公开(公告)号:CN103823652A

    公开(公告)日:2014-05-28

    申请号:CN201410064344.9

    申请日:2014-02-25

    Abstract: 本发明公开了一种信息输出方法,用于增强冰箱的提示效果。所述方法包括:在第一时刻,确定所述冰箱内存放的M个对象,并根据所述M个对象所分别对应的对象信息生成当前对象信息列表;M为正整数;将所述当前对象信息列表与预设对象信息列表进行比对,判断所述当前对象信息列表与所述预设对象信息列表是否相同;当所述当前对象信息列表与所述预设对象信息列表不相同时,根据所述当前对象信息列表与所述预设对象信息列表中不相同的对象信息生成并输出一更新对象信息列表。本发明还公开了相应的冰箱。

Patent Agency Ranking