-
公开(公告)号:CN116682441A
公开(公告)日:2023-09-01
申请号:CN202310657459.8
申请日:2023-06-05
Applicant: 北京工业大学
IPC: G10L21/003 , G10L25/30 , H04R23/00
Abstract: 一种骨传导耳机失真音质的矫正方法,属于骨传导耳机技术领域,基本思路是将骨传导耳机失真语音的矫正看作一个非线性建模问题,首先对语音进行分帧,利用语音编码器获取每帧语音的编码参数,以及语音的编码结果。利用神经网络的非线性映射能力,将骨传导耳机语音参数作为网络输入,正常语音参数作为网络输出对网络进行训练。利用训练好的网络,映射得到骨传导耳机语音矫正后的编码参数,将矫正参数与骨传导耳机编码结果输入到译码器,生成矫正语音,实现对骨传导耳机失真音质的矫正。本发明可提高骨传导耳机失真语音的清晰度和可懂度,对人类的社会生活、救援行动和军事活动都有着长远的意义。
-
公开(公告)号:CN117064636A
公开(公告)日:2023-11-17
申请号:CN202310684036.5
申请日:2023-06-10
Applicant: 北京工业大学
Abstract: 一种听觉代替视觉的导盲方法涉及电子信息领域。通过摄像头采集距离正前方3米左右的景像,同时送入图像转音乐模块进行图像到音乐的转化,首先将图像RGB空间转化到HSV空间,获取每个像素点的H、S、V的值。将H、S、V的值映射到音乐的midi格式文件的参数中,有6种映射方式,最佳映射方式为:H值赋给midi文件的音高参数,S值赋给midi文件的音量参数,V值赋给midi文件的delta‑time参数。通过得到的音乐midi文件参数值进行midi参数构造进而得到midi音乐文件。将H、S、V值与音量、音高、delta‑time参数匹配后进行映射,得到转化的音乐后,人耳听此声音,判断出正前方障碍物的有无情况,达到导盲的目的。编程实现了听觉代替视觉算法,为盲人提供价廉有效的辅助。
-