-
公开(公告)号:CN117475990A
公开(公告)日:2024-01-30
申请号:CN202311521545.2
申请日:2023-11-15
Applicant: 电子科技大学
Abstract: 本发明公开了一种结合人脸识别的屏幕定向发声方法。利用人脸识别技术对人脸特征属性进行分类识别,根据分类结果实现对目标对象定向播放与类别对应内容。利用声参量技术生成指向性的低频声波,可以使声波信号获得定向传播的能力,从而减少声音干扰;利用人脸属性识别,屏幕定向扬声器可以根据属性结果对不同的观众选择性播放不同内容,提升隐私性,更好地提供智能化服务。本发明的优点在于可以定向对观众播放与之匹配的内容,显著提高定向扬声器的利用率、极大提高播放内容与受众匹配程度。
-
公开(公告)号:CN117615288A
公开(公告)日:2024-02-27
申请号:CN202311612372.5
申请日:2023-11-29
Applicant: 电子科技大学
Abstract: 本发明提供了一种基于屏幕定向声技术的智能服务系统,系统包括USB和UART接口、电源、音频播放子模块、人体检测模块、存储子模块、麦克风语言录入模块、标准音频端子输入接口、服务选择子模块、音频翻译子模块、控制系统。所述音频播放子模块包括音频处理模块和静电薄膜超声换能器;所述音频翻译子模块包括音频信号输入模块、翻译API和译文语音信号输出模块;所述人体检测模块包括图像检测模块、判断模块与语音提示模块;所述静电薄膜超声换能器进行音频定向播放;所述控制系统对各模块进行控制并实现信息的传递。本发明通过静电薄膜超声换能器发出高指向性、低失真的声音,实现发声方向和角度的动态控制,从而达到声音防窥的效果。
-
公开(公告)号:CN116168293A
公开(公告)日:2023-05-26
申请号:CN202310129535.8
申请日:2023-02-17
Applicant: 电子科技大学
IPC: G06V20/10 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开一种基于改进的U²‑Net的变电站环境感知的方法,包括以下步骤:a、采集变电站数据集:获得变电站图像;b、标注数据集:按照景物类别对变电站图像标注标签,获得标注后的变电站图像;c、图像识别:采用改进的U²‑Net语义分割算法模型对标注后的变电站图像进行识别,输出与标签类别种类数量相同的分割图像。改进的U²‑Net语义分割算法模型的输出端的网络包括:encoder‑decoder模块,用于融合不同尺寸感受野的特征,捕获不同尺度的上下文信息;Focalloss损失函数,用于解决样本的非均衡性问题;GELU激活函数;网络输出层,使输出特征图上的每一个像素点都包含对应类的概率。本发明能够实时地、准确地识别出变电站物体信息的种类,对图像细节的分割效果好。
-
-