发明公开
- 专利标题: 一种基于视听多模态数据融合的抑郁症评估方法及设备
-
申请号: CN202410321485.8申请日: 2024-03-20
-
公开(公告)号: CN118173267A公开(公告)日: 2024-06-11
- 发明人: 刘磊 , 胡敏 , 王晓华 , 陈进 , 李鸿博 , 徐凌翔
- 申请人: 合肥工业大学
- 申请人地址: 安徽省合肥市包河区屯溪路193号
- 专利权人: 合肥工业大学
- 当前专利权人: 合肥工业大学
- 当前专利权人地址: 安徽省合肥市包河区屯溪路193号
- 代理机构: 合肥天明专利事务所
- 代理商 洪杰
- 主分类号: G16H50/30
- IPC分类号: G16H50/30 ; G16H50/70 ; G06V40/16 ; G06V10/52 ; G06V10/80 ; G06V10/82 ; G06F18/25 ; G10L15/02 ; G10L15/16 ; G10L25/30 ; G10L25/66 ; G10L25/24 ; G06N3/045 ; G06N3/0442 ; G06N3/0464 ; G06N3/084
摘要:
本发明公开了一种基于视听多模态数据融合的抑郁症评估方法,包括以下步骤:步骤1、获取受试者的面部视频及受试者音频;步骤2、得到受试者的低级视觉特征和低级音频特征;步骤3、将步骤2获取的低级视觉特征和低级音频特征输入到并行多尺度桥融合抑郁症评估PMBFN网络进行处理并得到抑郁症评级;本发明通过构建视觉与音频分支的空间编码模块、并行多尺度动态卷积模块与时空注意力池化模块,快速、高效地从视听多模态数据中提取出多尺度深度特征,全面捕获抑郁行为的动态表现,并在多模态桥融合模块的调整下,使得模态之间数据充分交互,提升多模态数据的利用率,从而提高自动抑郁症评估的准确度与效率。