Patent search ap:("北京工业大学") AND inv:"王相焜" Page 1

1.

发明公开
一种骨传导耳机失真音质的矫正方法审中-实审

公开(公告)号：CN116682441A

公开(公告)日：2023-09-01

申请号：CN202310657459.8

申请日：2023-06-05

Applicant: 北京工业大学

Inventor： 王波涛 , 赵晶晶 , 王相焜 , 陈聪实

IPC: G10L21/003 , G10L25/30 , H04R23/00

Abstract: 一种骨传导耳机失真音质的矫正方法，属于骨传导耳机技术领域，基本思路是将骨传导耳机失真语音的矫正看作一个非线性建模问题，首先对语音进行分帧，利用语音编码器获取每帧语音的编码参数，以及语音的编码结果。利用神经网络的非线性映射能力，将骨传导耳机语音参数作为网络输入，正常语音参数作为网络输出对网络进行训练。利用训练好的网络，映射得到骨传导耳机语音矫正后的编码参数，将矫正参数与骨传导耳机编码结果输入到译码器，生成矫正语音，实现对骨传导耳机失真音质的矫正。本发明可提高骨传导耳机失真语音的清晰度和可懂度，对人类的社会生活、救援行动和军事活动都有着长远的意义。

2.

发明公开
一种听觉代替视觉的导盲方法审中-实审

公开(公告)号：CN117064636A

公开(公告)日：2023-11-17

申请号：CN202310684036.5

申请日：2023-06-10

Applicant: 北京工业大学

Inventor： 王波涛 , 苗嘉琦 , 王相焜

IPC: A61F9/08 , A61H3/06

Abstract: 一种听觉代替视觉的导盲方法涉及电子信息领域。通过摄像头采集距离正前方3米左右的景像，同时送入图像转音乐模块进行图像到音乐的转化，首先将图像RGB空间转化到HSV空间，获取每个像素点的H、S、V的值。将H、S、V的值映射到音乐的midi格式文件的参数中，有6种映射方式，最佳映射方式为：H值赋给midi文件的音高参数，S值赋给midi文件的音量参数，V值赋给midi文件的delta‑time参数。通过得到的音乐midi文件参数值进行midi参数构造进而得到midi音乐文件。将H、S、V值与音量、音高、delta‑time参数匹配后进行映射，得到转化的音乐后，人耳听此声音，判断出正前方障碍物的有无情况，达到导盲的目的。编程实现了听觉代替视觉算法，为盲人提供价廉有效的辅助。

Patent Agency Ranking