基于语音特征和说话人特征融合的病理嗓音质量评价方法

发明授权

CN116110437B 基于语音特征和说话人特征融合的病理嗓音质量评价方法有权

请登陆查看更多内容

专利标题： 基于语音特征和说话人特征融合的病理嗓音质量评价方法
申请号： CN202310395720.1

申请日： 2023-04-14
公开(公告)号： CN116110437B

公开(公告)日： 2023-06-13
发明人: 张涛 , 侯晓慧 , 刘赣俊 , 赵鑫
申请人： 天津大学
申请人地址： 天津市南开区卫津路92号
专利权人： 天津大学
当前专利权人： 天津大学
当前专利权人地址： 天津市南开区卫津路92号
代理机构： 天津心知意达知识产权代理事务所
代理商 赵雪红
主分类号： G10L25/66
IPC分类号： G10L25/66 ; G10L15/02 ; G10L15/16 ; G10L25/24 ; G10L25/30 ; A61B5/00 ; G06N3/049 ; G06F18/25

摘要：

本发明提供了一种基于语音特征和说话人特征融合的病理嗓音质量评价方法，输入病理嗓音，提取频谱图、梅尔频率倒谱系数两种语音特征，并进行特征融合；将融合后的语音特征作为输入，对其进行时间信息的提取以及帧级分数的预测；将梅尔频率倒谱系数语音特征作为输入，进行说话人特征的提取；对经过时间信息提取后所得的语音特征和所得的说话人特征作为输入，进行特征融合，得到话语级质量分数的预测。本发明通过从病理嗓音中提取语音特征和说话人特征，并进行特征融合，最后进行分数预测，找到病理嗓音与其所对应的主观质量分数之间的映射关系，从而实现对病理嗓音质量做出客观、定量的评价。

公开/授权文献

CN116110437A 基于语音特征和说话人特征融合的病理嗓音质量评价方法公开/授权日：2023-05-12

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/48	.专门适用于特定用途
G10L25/51	..比较或判别
G10L25/66	...提取与健康状况相关的参数（用于诊断目的的检测或测量的入A61B5/00）