- 专利标题: 基于语音特征和说话人特征融合的病理嗓音质量评价方法
-
申请号: CN202310395720.1申请日: 2023-04-14
-
公开(公告)号: CN116110437B公开(公告)日: 2023-06-13
- 发明人: 张涛 , 侯晓慧 , 刘赣俊 , 赵鑫
- 申请人: 天津大学
- 申请人地址: 天津市南开区卫津路92号
- 专利权人: 天津大学
- 当前专利权人: 天津大学
- 当前专利权人地址: 天津市南开区卫津路92号
- 代理机构: 天津心知意达知识产权代理事务所
- 代理商 赵雪红
- 主分类号: G10L25/66
- IPC分类号: G10L25/66 ; G10L15/02 ; G10L15/16 ; G10L25/24 ; G10L25/30 ; A61B5/00 ; G06N3/049 ; G06F18/25
摘要:
本发明提供了一种基于语音特征和说话人特征融合的病理嗓音质量评价方法,输入病理嗓音,提取频谱图、梅尔频率倒谱系数两种语音特征,并进行特征融合;将融合后的语音特征作为输入,对其进行时间信息的提取以及帧级分数的预测;将梅尔频率倒谱系数语音特征作为输入,进行说话人特征的提取;对经过时间信息提取后所得的语音特征和所得的说话人特征作为输入,进行特征融合,得到话语级质量分数的预测。本发明通过从病理嗓音中提取语音特征和说话人特征,并进行特征融合,最后进行分数预测,找到病理嗓音与其所对应的主观质量分数之间的映射关系,从而实现对病理嗓音质量做出客观、定量的评价。
公开/授权文献
- CN116110437A 基于语音特征和说话人特征融合的病理嗓音质量评价方法 公开/授权日:2023-05-12