-
公开(公告)号:CN115810357A
公开(公告)日:2023-03-17
申请号:CN202211503850.4
申请日:2022-11-28
Abstract: 本申请涉及一种轻量级语音关键词识别方法、设备、介质,所述方法包括:获取待识别语音,并转换为特征帧向量,输入关键词识别模型,获取与目标关键词匹配的分类标签的概率数组,根据概率数组确定待识别语音内是否包含目标关键词,其中,关键词识别模型包括:时间卷积模块,包括多个按照预设的空洞系数组合的卷积层,用于提取时序间相关性信息;嵌套模块;压缩模块,包括多个按照预设的步长组合的卷积层,用于对时间卷积模块和嵌套模块的输出在通道深度拼接后的数据进行压缩与特征提取;全连接分类输出模块,用于获取概率数组。在参数量及运算复杂度均较小的轻量级约束下,本方法获得了较好识别准确率,从而更适合在嵌入式系统上进行部署。
-
公开(公告)号:CN115880888B
公开(公告)日:2025-01-24
申请号:CN202211503899.X
申请日:2022-11-28
Abstract: 本发明涉及一种基于数字孪生的交叉路口安全引导方法、设备、介质,所述方法包括如下步骤:模型构建:3D软件中构建城市交叉路口系统及弱势群体模型;神经网络模型的部署和训练:3D软件中在摄像机视角下采集路口弱势群体图像信息获取训练集进行训练;数据采集与处理:3D软件中的摄像机采集图像数据。边缘计算主机处理图像。结果传输至虚拟环境服务器及实体交通设备控制端;控制交通设备:接收信号,控制红绿灯及音频设备,通过语音播报引导目标通过路口。本方法可以很好的解决交叉路口安全引导弱势群体这一难题。与传统方法相比,本方法成本低、可拓展性强、非佩戴式且适用范围广。
-
公开(公告)号:CN116649909A
公开(公告)日:2023-08-29
申请号:CN202310671545.4
申请日:2023-06-07
Applicant: 复旦大学附属中山医院
IPC: A61B5/00 , G06V10/26 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于神经网络算法的色素性皮肤病皮损面积量化诊断系统,其特征在于,包括图像获取单元;标定比色卡;图像预处理单元;深度神经网络;内参标定单元;三维位姿关系结算单元;皮损区域真实面积计算单元。将比色卡放置色素性皮损旁对皮损区域进行拍摄,随后上传照片至本发明公开的系统即可自动解算出皮损区域面积。本发明能够定量地评估色素性皮肤病患者皮损区域面积,相对于医师肉眼评估及计算机传统算法更为精确、更为便捷。
-
公开(公告)号:CN117115245A
公开(公告)日:2023-11-24
申请号:CN202310670461.9
申请日:2023-06-07
Applicant: 复旦大学
Abstract: 本发明提供一种融合单目图像语义信息的结合楼层平面图信息的室内语义定位方法,该法通过OCR检测识别场景单目图象中的商户招牌,确定二维特征子与三维地图点映射关系,完成稀疏点云地图与室内楼层平面图的现实锚定,优选ORB‑SLAM算法,将待测图像序列与关键帧库比对进行重定位,实现了移动端相机位置三维坐标的确定,实现高效的语义SLAM功能。通过本发明的方法,能够克服融合语义信息的SLAM技术在复杂场景中运算成本高、场景适应能力差的问题,实现融合室内楼层平面图的移动端低算力、高鲁棒性的语义同步定位与建图,适合手机等移动设备在地下停车场、室内商超等场景中应用。
-
公开(公告)号:CN115880888A
公开(公告)日:2023-03-31
申请号:CN202211503899.X
申请日:2022-11-28
Abstract: 本发明涉及一种基于数字孪生的交叉路口安全引导方法、设备、介质,所述方法包括如下步骤:模型构建:3D软件中构建城市交叉路口系统及弱势群体模型;神经网络模型的部署和训练:3D软件中在摄像机视角下采集路口弱势群体图像信息获取训练集进行训练;数据采集与处理:3D软件中的摄像机采集图像数据。边缘计算主机处理图像。结果传输至虚拟环境服务器及实体交通设备控制端;控制交通设备:接收信号,控制红绿灯及音频设备,通过语音播报引导目标通过路口。本方法可以很好的解决交叉路口安全引导弱势群体这一难题。与传统方法相比,本方法成本低、可拓展性强、非佩戴式且适用范围广。
-
公开(公告)号:CN113643212B
公开(公告)日:2024-04-05
申请号:CN202110994446.0
申请日:2021-08-27
Applicant: 复旦大学
IPC: G06T5/70 , G06T5/60 , G06N3/0464 , G06N3/045 , G06N3/084
Abstract: 本发明提供一种基于图神经网络的深度图降噪方法,包括如下步骤:步骤1,获取二维的RGB图像和深度图像并进行特征选择,得到相应的特征通道数据,而后将已选择的特征通道数据映射为向量形式,得到多个特征向量并进行拼接,得到特征矩阵,同时采用田字结构选择邻居节点,构造邻接表;步骤2,构造基于图卷积网络GCN和注意力机制层的网络模型;步骤3,对误差函数进行优化,而后与网络模型结合,得到优化后的网络模型;步骤4,将特征矩阵和邻接表输入优化后的网络模型,得到降噪后的深度图像。采用本发明的方法降低了网络模型的参数量,无需对图像进行裁剪,有效地提高了端到端网络的深度图降噪的性能。
-
公开(公告)号:CN113643212A
公开(公告)日:2021-11-12
申请号:CN202110994446.0
申请日:2021-08-27
Applicant: 复旦大学
Abstract: 本发明提供一种基于图神经网络的深度图降噪方法,包括如下步骤:步骤1,获取二维的RGB图像和深度图像并进行特征选择,得到相应的特征通道数据,而后将已选择的特征通道数据映射为向量形式,得到多个特征向量并进行拼接,得到特征矩阵,同时采用田字结构选择邻居节点,构造邻接表;步骤2,构造基于图卷积网络GCN和注意力机制层的网络模型;步骤3,对误差函数进行优化,而后与网络模型结合,得到优化后的网络模型;步骤4,将特征矩阵和邻接表输入优化后的网络模型,得到降噪后的深度图像。采用本发明的方法降低了网络模型的参数量,无需对图像进行裁剪,有效地提高了端到端网络的深度图降噪的性能。
-
-
-
-
-
-