发明公开
- 专利标题: 音频情绪识别模型的训练方法、装置、设备和可读介质
-
申请号: CN202311542716.X申请日: 2023-11-17
-
公开(公告)号: CN117711441A公开(公告)日: 2024-03-15
- 发明人: 曾孙禄 , 王培英 , 何晓冬 , 陈俊卿 , 范璐 , 陈蒙
- 申请人: 京东城市(北京)数字科技有限公司 , 京东科技信息技术有限公司
- 申请人地址: 北京市海淀区知春路76号(写字楼)1号楼9层1-7-5号;
- 专利权人: 京东城市(北京)数字科技有限公司,京东科技信息技术有限公司
- 当前专利权人: 京东城市(北京)数字科技有限公司,京东科技信息技术有限公司
- 当前专利权人地址: 北京市海淀区知春路76号(写字楼)1号楼9层1-7-5号;
- 代理机构: 北京律智知识产权代理有限公司
- 代理商 陈媛婧
- 主分类号: G10L25/63
- IPC分类号: G10L25/63 ; G10L25/06 ; G10L25/30 ; G10L15/06
摘要:
本公开提供一种音频情绪识别模型的训练方法、装置、设备和可读介质,其中,音频情绪识别模型的训练方法包括:提取音频样本中的关键帧的语音状态;根据预设的嵌入向量编码信息确定关键帧的语音状态对应的情绪标签嵌入向量;根据情绪标签嵌入向量和音频样本的独热向量确定损失函数的输入;基于损失函数对音频情绪识别模型进行训练。通过本公开实施例,使得音频情绪识别模型在训练过程中能够学习到更加泛化的情绪特征,更准确且可靠地进行情绪识别。