-
公开(公告)号:CN114647301B
公开(公告)日:2024-08-27
申请号:CN202011504063.2
申请日:2020-12-17
申请人: 上海交通大学
摘要: 本发明涉及一种基于声音信号的车载应用手势交互方法及系统,方法包括以下步骤:设置手势识别范围;获取各个手势的声音信号集;得到各个声音信号集的特征向量集;以特征向量集为训练集训练机器学习模型;设置每个手势对应的车载应用功能;采集用户做出的手势的原始声音信号,对原始声音信号进行数据预处理和特征提取得到特征向量;基于特征向量和机器学习模型得到识别手势,进行交互。与现有技术相比,本发明通过扬声器和麦克风,采集用户做出手势动作时的原始声音信号,即手部与麦克风的时间‑距离序列,再通过训练好的机器学习模型识别用户的手势,进而控制车载应用,实现无接触式交互,适用于不同的环境,准确率较高,且保证了用户的隐私。
-
公开(公告)号:CN118330559A
公开(公告)日:2024-07-12
申请号:CN202310038257.5
申请日:2023-01-10
申请人: 上海交通大学 , 江苏嘉图网络科技股份有限公司
IPC分类号: G01S5/06 , G06F18/23213 , G06F18/22 , H04W64/00 , H04W4/029 , H04W4/33 , H04L25/02 , G01C21/20
摘要: 本发明涉及一种基于5G极化天线信号的高空间解析度图书馆定位方法,该方法为:使用者携带手机进行5G数据传输,对到达5G极化天线的无线信号进行解析,从信道状态同时解耦出到达角、偏振角、飞行时间及多普勒频移,进而推算使用者的空间位置,实现用户追踪,再利用实时更新的坐标位置和图书馆地图实现寻书导航。与现有技术相比,本发明具有定位精度高的优点。
-
公开(公告)号:CN117890461A
公开(公告)日:2024-04-16
申请号:CN202311789167.6
申请日:2023-12-25
申请人: 上海交通大学
摘要: 本发明涉及一种基于声学感知的液体种类检测方法、装置及介质,其中方法包括以下步骤:利用声音信号发送设备和声音信号接收设备感知待检测液体中包含的声学属性相关的信息,获取接收信号;对接收信号进行计算,获取信道传递函数的相位、幅值和信道的信噪比以及发送信号在液体中引起的声学非线性效应系数,作为液体的声学特征;将液体的声音特征作为输入,将待检测液体的种类作为标签,对神经网络或者机器学习模型的参数进行训练;对于新的待检测液体,获取信号并计算声学特征,输入已训练好的模型,获得新的待检测液体的种类。与现有技术相比,本发明具有扩大了液体检测种类的范围、可以检测液体中存在的不溶于液体的物质等优点。
-
公开(公告)号:CN117854467A
公开(公告)日:2024-04-09
申请号:CN202311813213.1
申请日:2023-12-26
申请人: 上海交通大学
IPC分类号: G10K11/178 , G10K11/26 , H04B11/00
摘要: 本发明涉及一种适用于主动降噪系统隐蔽通讯的音频处理方法及装置,该方法包括:获取原始音频,并从原始音频中截取预发送的频段信号;将截取的频段信号调制到互不重叠的超声波段;将调制后的音频合并为一个组合音频;根据主动降噪系统所处位置方向以及组合音频的频带分布,计算出相控阵中每个阵元所发音频的相位延迟;根据计算的相位延迟,在组合音频的相位谱中进行补偿,之后通过相控阵将补偿后的组合音频发送出去;主动降噪系统接收到组合音频,通过接收电路产生原始音频,并结合主动降噪算法处理,还原得到声信号。与现有技术相比,本发明能够缩短通信系统响应时间、简化通信系统结构,在低成本的前提下实现远距离、多角度并发隐蔽通讯的目的。
-
公开(公告)号:CN117807774A
公开(公告)日:2024-04-02
申请号:CN202311814673.6
申请日:2023-12-26
申请人: 上海交通大学
IPC分类号: G06F30/20
摘要: 本发明涉及一种利用空气非线性的多指向声音投射方法,包括:设计声学超表面,以重构声波阵面形状,降低阵列元之间间距、减小栅瓣产生;基于优化的波束成形算法,以减小波束间的非线性干扰以及非线性失真。与现有技术相比,本发明将声学超表面覆盖在传统的超声振子上,克服了传统超声振子尺寸大、出射波束锥形角的特征导致的传统参量阵波束栅瓣以及覆盖角度窄的局限性,覆盖了更宽范围的扫角并减小了栅瓣的产生;本发明设计优化的波束成形算法,能够在多波束投射的情况下,减小波束间的干扰,防止音频泄露的产生,而且优化的波束成形算法仅和目标角度有关,和目标音频内容无关,减小了计算开销,此外能够减小非线性失真,提升用户听觉体验。
-
公开(公告)号:CN114710419A
公开(公告)日:2022-07-05
申请号:CN202210157335.9
申请日:2022-02-21
申请人: 上海交通大学
摘要: 本发明涉及一种基于开关电源声音的设备工作状态单点监测方法、装置及存储介质,其中方法利用了智能音箱中内建的麦克风实现了在不借助额外硬件设备的前提下远距离单点探测屋内电子设备的工作情况。具体实现了一个智能音箱原型,通过智能音箱自带的麦克风监听音箱开关电源适配器发出的声音,监测屋内电子设备的开关及其工作状态。该方法实现了在不借助额外硬件设备情况下单点、远距离地探测屋内多个电子设备工作情况,优化了智能家居生态系统。
-
公开(公告)号:CN116071493A
公开(公告)日:2023-05-05
申请号:CN202211614686.4
申请日:2022-12-15
申请人: 上海交通大学
摘要: 本发明涉及一种基于OIS控制的移动设备深度图重建方法,包括以下步骤:获取移动设备共振频率;基于共振频率,用振幅和频率调制声学注入信号;在移动设备的镜头静止时拍摄参考帧;用调制的声学注入信号控制镜头抖动,并在抖动过程中采集偏移帧,同时记录移动设备的陀螺仪和加速度计测量值,基于陀螺仪和加速度计测量值确定OIS的控制信号;基于OIS的控制信号,利用光束平差法计算相机位姿;基于相机位姿,使用平面扫描算法重建稠密深度,实现深度图的几何重建。与现有技术相比,本发明具有重建精度高、适用范围广等优点。
-
公开(公告)号:CN114648772A
公开(公告)日:2022-06-21
申请号:CN202011504052.4
申请日:2020-12-17
申请人: 上海交通大学
IPC分类号: G06V30/413 , G06N3/00 , G10L15/08
摘要: 本发明涉及一种基于声音信号的手写文本识别方法及系统,方法包括以下步骤:设置文本识别范围;将多个不同用户的手写文字图片集转换为声音信号;进入初始化阶段,基于随机森林模型和用户确认输出文字识别结果,得到文本识别范围内所有文字的增强识别集;进入使用阶段,使用KNN分类算法在增强识别集中找到与用户手写文字的特征声音信号最接近的声音信号,从而实现文本识别;纠错处理。与现有技术相比,本发明在保证用户隐私的前提下,通过声音信号对用户输入的手写文本进行识别,实现无接触的手写文本输入识别,能在不同环境下实现对不同语言的识别,适用范围广,可靠性高,降低了误识别的可能性。
-
公开(公告)号:CN114548217A
公开(公告)日:2022-05-27
申请号:CN202210004840.X
申请日:2022-01-05
申请人: 上海交通大学
摘要: 本发明涉及一种基于机器学习的电器类别及使用状态识别方法及插座设备,具体包括:S1、采集多个待测电器在持续使用中的电流数据,构建电器电流数据集;S2、构造电器使用状态分类网络,得到电器使用状态分类模型,对电器状态进行分类,根据分类结果进行划分得到电器状态电流数据集;S3、对电器状态电流数据集进行特征提取,并根据特征构建电器类别及使用状态分类网络,得到电器类别及使用状态分类模型进行训练;S4、根据完成训练的电器类别及使用状态分类模型,识别插入的待测电器的电器类别及使用状态,并预测电器的功耗。与现有技术相比,本发明具有提高智能电器使用过程中的安全性、降低智能插座的成本、实现对电器使用全状态的分类等优点。
-
公开(公告)号:CN118486333A
公开(公告)日:2024-08-13
申请号:CN202410576381.1
申请日:2024-05-10
申请人: 上海声通信息科技股份有限公司 , 上海交通大学
摘要: 本发明涉及一种基于声纹和文本的多模态情感识别方法,包括:收集多个中文日常单句对话语料,构建中文会话情感语料库,包括多个音频信号及对应的文本信息、对应的标签;构建多模态模型,并利用中文会话情感语料库进行训练,得到情感识别模型;将待识别的中文语料切分为单句内容后输入情感识别模型,输出得到相应的情感预测结果。与现有技术相比,本发明创建一个全新的中文会话情感语料库,补充了中文语料在情绪识别领域中的不足;并设计多模态情感识别模型,用于处理声学数据和文本数据(包含词嵌入和预训练的BERT嵌入),使用共注意结构进行多模态特征融合,能够有效提高情感识别的准确性和稳定性。
-
-
-
-
-
-
-
-
-