一种体征检测方法、系统、存储介质及计算装置

    公开(公告)号:CN115966211A

    公开(公告)日:2023-04-14

    申请号:CN202211410106.X

    申请日:2022-11-10

    摘要: 一种体征检测方法和系统,体征检测方法包括以下步骤:S1,获取使用者的启动语音指令;S2,根据启动语音指令形成启动语音指令的声纹特征向量;S3,将启动语音指令的声纹特征向量与声纹模型库中的目标用户的声纹向量逐一进行匹配并获得匹配度评分;S4,获取的最高的匹配度评分大于等于第一设定阈值时,启动体征检测装置。体征检测系统包括:语音接获取模块、声纹特征向量形成模块、声纹向量匹配模块和阈值比较模块。使用者只需要发出启动语音指令即可完成目标用户的识别和体征检测装置启动,克服了需要使用者用与智能尿检设备通信连接的手机确认个人信息,才能给每次尿检结果数据打上身份标签所存在的步骤繁琐和易用性差的问题。

    一种语音交互方法及相关电子设备

    公开(公告)号:CN115881118A

    公开(公告)日:2023-03-31

    申请号:CN202211376580.5

    申请日:2022-11-04

    摘要: 本申请提供一种语音交互方法及相关电子设备,该方法包括:接收第一语音信号;在确定第一语音信号要进行语音检测的情况下,基于第一语音信号得到语音信号数据;将语音信号数据通过语音检测模型处理,得到第一置信度;获取电子设备的加速度数据,并基于加速度数据得到电子设备的位姿信息;将位姿信息通过位姿检测模型进行处理,得到第二置信度;将目标位姿信息和语音数据通过音频‑位姿检测融合模型进行处理,得到第三置信度;基于第一置信度、第二置信度和第三置信度判断是否启动语音交互应用。通过上述方法,能够避免电子设备的语音交互应用被误唤醒。

    声纹编码网络的训练方法及装置

    公开(公告)号:CN113299295B

    公开(公告)日:2022-12-30

    申请号:CN202110513396.X

    申请日:2021-05-11

    发明人: 王志铭 熊涛

    IPC分类号: G10L17/04 G10L17/08 G10L17/18

    摘要: 本说明书实施例提供了一种声纹编码网络的训练方法,包括:获取第一语音片段对应的声学特征和说话人标识;将该声学特征输入声纹编码网络,得到第一编码向量;确定第一训练损失,其负相关于该说话人标识对应的类别权重向量与第一编码向量之间的第一相似度,且正相关于预先设定的边际参数;确定第二训练损失,该第二训练损失正相关于第一语音片段与其同类语音片段各自所对应编码向量之间的同类间距离,且负相关于第一语音片段与其异类语音片段各自所对应编码向量之间的第一异类间距离;基于第一训练损失和第二训练损失,训练声纹编码网络和类别权重向量。

    声纹识别方法、系统、移动终端及存储介质

    公开(公告)号:CN111243603B

    公开(公告)日:2022-12-06

    申请号:CN202010020758.7

    申请日:2020-01-09

    摘要: 本发明提供了一种声纹识别方法、系统、移动终端及存储介质,该方法包括:获取样本数据,根据本地预设音素对样本数据进行音素提取,得到样本语音段及样本语音段对应的用户标识;根据样本语音段和用户标识对声纹识别模型进行声纹注册,并获取待识别语音;将待识别语音输入声纹识别模型,并控制声纹识别模型对待识别语音中的待识别音素与样本语音段进行声纹匹配,得到匹配结果;当判断到匹配结果满足输出条件时,根据匹配结果查询目标用户标识,并将目标用户标识进行输出。本发明通过基于音素的提取进行声纹注册,以采用音素匹配的方式进行待识别语音的声纹识别,有效的提高了声纹识别的识别效率和准确性。

    声纹识别模型的训练方法、声纹识别方法、装置及设备

    公开(公告)号:CN115424621A

    公开(公告)日:2022-12-02

    申请号:CN202211349630.0

    申请日:2022-10-31

    摘要: 本发明实施例涉及一种声纹识别模型的训练方法、声纹识别方法、装置及设备,涉及语音识别领域,通过迭代执行对所述当前语音数据子集中的语音数据进行预处理,获得语音片段;确定第一对比正对和对比负对;将每个语音片段输入到上一迭代获得的深度残差网络模型中,获得对应的说话人嵌入;针对每个说话人嵌入,从预设说话人嵌入队列中确定对应的最近邻正实例,并确定第二对比正对;根据所述第一对比正对、第二对比正对和对比负对对所述上一迭代获得的深度残差网络模型进行训练,获得当前深度残差网络模型;即本发明的实施例通过额外引入的说话人嵌入队列,选取最近邻正实例来构成额外的对比正对,使得训练出的声纹识别模型准确性更高。

    服务机器人听觉感知家庭成员饮食信息的方法

    公开(公告)号:CN109325236B

    公开(公告)日:2022-11-29

    申请号:CN201811217808.X

    申请日:2018-10-18

    申请人: 贵州大学

    摘要: 本发明公开了一种服务机器人听觉感知家庭成员饮食信息的方法,包括以下步骤:(1)通过服务机器人获取说话人语音数据,并判断系统工作模式;(2)当系统处于模式一时,利用声纹识别和语音识别技术获取当前语音数据的说话人身份信息和对应的文本数据;(3)当系统处于模式二时,利用语音分割将语音数据根据说话人身份转换点进行分割,并利用声纹识别将相邻的同身份语音片段连接;获取连接后不同语音片段的说话人身份信息和对应的文本数据;(4)利用中文分词、词性标注和依存句法分析算法,对不同人的饮食信息进行抽取,并根据身份信息存储饮食信息。本发明能够自主获取不同用户的饮食信息,并根据不同用户的身份信息建立饮食信息档案。

    提高多对象说话场景下语音识别准确性的方法、装置及设备

    公开(公告)号:CN115295000A

    公开(公告)日:2022-11-04

    申请号:CN202211220119.0

    申请日:2022-10-08

    发明人: 陶贵宾

    摘要: 本公开涉及一种提高多对象说话场景下语音识别准确性的方法、装置及设备。包括:获取多个对象的待识别语音音频,确定各对象相对于其他对象的皮尔逊相关系数,根据皮尔逊相关系数从麦克风阵列中确定极点麦克风和极轴麦克风;根据待识别语音音频相对极点麦克风的信号强度,对多个对象进行区域划分;根据区域的数量和采集间隔时长从预设差分阵列系数确定目标差分阵列系数,根据极点和极轴麦克风构建极坐标系,确定麦克风在极坐标系中的坐标;根据坐标和目标差分阵列系数,提取待识别语音音频的纯净峰信息和混合峰信息,根据纯净峰信息和混合峰信息对待识别语音音频进行对象区分,对对象区分后待识别语音音频进行波束成形及识别得到语音识别结果。

    一种说话者确认方法及系统

    公开(公告)号:CN113345444B

    公开(公告)日:2022-10-28

    申请号:CN202110496856.2

    申请日:2021-05-07

    摘要: 本发明提供一种说话者确认方法及系统,包括:对说话者的音频信息进行预处理,将所述音频信息转换为预设格式的数据;将说话者音频信息对应的预设格式的数据输入到训练好的基于空间注意力机制的深度嵌套残差神经网络,以得到帧级别的说话者向量;基于所述帧级别的说话者向量生成话语级别的说话者向量,并计算所述话语级别的说话者向量和目标说话者向量的余弦相似度,以判断所述说话者是否为目标说话者;所述目标说话者向量是预先获取的。本发明提出了一种基于空间注意力机制的深度嵌套残差神经网络,通过深度神经网络更准确地提取说话者声纹特征。

    跨屏播放的控制方法、装置、设备及计算机存储介质

    公开(公告)号:CN115119041A

    公开(公告)日:2022-09-27

    申请号:CN202210708332.X

    申请日:2022-06-17

    发明人: 李志水

    摘要: 本发明涉及跨屏控制领域,并公开了一种跨屏播放的控制方法、装置、设备和计算机存储介质,该方法包括:若采集到实时声音信息,则确定预设的跨屏资源库中所述实时声音信息对应的实际识别信息;根据所述实际识别信息确定待跨屏播放信息,并检测是否接收到输入的默认控制信息;若接收到输入的默认控制信息,则根据所述实际识别信息和所述待跨屏播放信息进行跨屏播放。本发明提高了跨屏播放的智能性。

    语音唤醒方法、设备及存储介质

    公开(公告)号:CN111696562B

    公开(公告)日:2022-08-19

    申请号:CN202010353897.1

    申请日:2020-04-29

    IPC分类号: G10L17/24 G10L17/06 G10L17/08

    摘要: 本申请实施例提供一种语音唤醒方法、设备及存储介质,用于解决当前设备组中主设备唤醒率低的问题。该方法包括:主设备通过将设备组内其他从设备的唤醒识别结果引入到主设备的唤醒决策中,根据主设备自身的唤醒识别结果以及设备组内其他从设备的唤醒识别结果,确定主设备是否被唤醒,该方法提高了设备组中主设备被唤醒的准确性。进一步地,主设备还可以采用连续或者离散方式,动态调整设备组内主设备的预设唤醒阈值,并根据调整后的唤醒阈值确定主设备是否被唤醒,动态调整后的唤醒阈值更加契合整个设备组唤醒的实际状态,主设备基于动态调整后的唤醒阈值进行唤醒决策,唤醒设备的准确性更高。