一种电力维修场景下的流式语音识别方法及系统

    公开(公告)号:CN118782023A

    公开(公告)日:2024-10-15

    申请号:CN202411090688.7

    申请日:2024-08-09

    Abstract: 本发明公开了一种电力维修场景下的流式语音识别方法及系统,属于语音识别技术领域,包括收集包含电力系统维护场景的语音数据;对所述语音数据进行预处理并标注,得到标注的语音数据;对标注后的语音数据进行分段处理,提取每段语音数据的动态特征和静态特征,将所述动态特征和静态特征拼接后作为每段语音数据的特征向量;将每段语音数据的特征向量输入至流式语音识别模型进行训练,得到训练好的电力场景下的流式语音识别模型;获取当前语音数据,对当前语音数据进行识别。通过构建并训练流式语音识别模型提高语音识别的实时性,并且还通过结合静态特征和动态特征可以捕捉更多语音信号的细节和变化,提高语音识别模型的准确性和鲁棒性。

Patent Agency Ranking