基于车载多模交互的语音识别方法及装置、介质和设备

    公开(公告)号:CN115410561B

    公开(公告)日:2023-02-17

    申请号:CN202211359138.1

    申请日:2022-11-02

    IPC分类号: G10L15/08 G06V40/20 G06V10/80

    摘要: 本发明涉及数据处理领域,公开了一种基于车载多模交互的语音识别方法及装置、介质、设备,包括:获取车内语音数据,从车内语音数据中提取出语音特征向量;提取出面部特征向量、唇部特征向量、手势特征向量;获取车辆状态数据,从车辆状态数据中提取出车辆状态特征向量;确定面部特征向量、唇部特征向量、手势特征向量和车辆状态特征向量各自对应的调和系数;将面部特征向量、唇部特征向量、手势特征向量和车辆状态特征向量进行多模融合,得到第一融合特征向量;将第一融合特征向量和语音特征向量进行融合处理,得到第二融合特征向量;将第二融合特征向量输入至语音识别模型中,得到语音识别结果。本发明实施例可以提高车载语音识别准确率。

    基于车载多模交互的语音识别方法及装置、介质和设备

    公开(公告)号:CN115410561A

    公开(公告)日:2022-11-29

    申请号:CN202211359138.1

    申请日:2022-11-02

    IPC分类号: G10L15/08 G06V40/20 G06V10/80

    摘要: 本发明涉及数据处理领域,公开了一种基于车载多模交互的语音识别方法及装置、介质、设备,包括:获取车内语音数据,从车内语音数据中提取出语音特征向量;提取出面部特征向量、唇部特征向量、手势特征向量;获取车辆状态数据,从车辆状态数据中提取出车辆状态特征向量;确定面部特征向量、唇部特征向量、手势特征向量和车辆状态特征向量各自对应的调和系数;将面部特征向量、唇部特征向量、手势特征向量和车辆状态特征向量进行多模融合,得到第一融合特征向量;将第一融合特征向量和语音特征向量进行融合处理,得到第二融合特征向量;将第二融合特征向量输入至语音识别模型中,得到语音识别结果。本发明实施例可以提高车载语音识别准确率。

    无人车
    5.
    实用新型

    公开(公告)号:CN215043255U

    公开(公告)日:2021-12-07

    申请号:CN202120697415.4

    申请日:2021-04-06

    IPC分类号: B62D63/02 B62D63/04

    摘要: 本实用新型涉及一种无人车。所述无人车包括主体车身,主体车身包括上装组件和设置于上装组件下方的底盘组件;上装组件包括功能区和与功能区相连的可拆卸的交互模块;功能区内设置有可拆卸的快递柜模块、可拆卸的售卖机模块或可拆卸的配送柜模块;交互模块分别与快递柜模块、售卖机模块和配送柜模块电连接;底盘组件包括底盘车架和与底盘车架相连的至少一个防护模块。该无人车采用模块化设计,可根据使用需求配置相应的模块,以实现快递投放、商品售卖或大件货物配送,使用灵活便捷,可采用一个主体车身实现多个不同的功能,大大降低了成本;且底盘组件包括底盘车架和防护模块,防护模块可提高车辆的使用安全性。