-
公开(公告)号:CN119992265A
公开(公告)日:2025-05-13
申请号:CN202411892841.8
申请日:2024-12-20
Applicant: 北京工业大学
IPC: G06V10/80 , G06V10/40 , G06V10/774 , G06V10/82 , G06V10/764 , G06V20/58 , G06N3/044 , G06N3/048 , B60W50/00 , B60W60/00
Abstract: 本发明实施例提供一种自动驾驶目标检测系统及方法,属于目标检测技术领域。系统包括:相机网络分支,用于获取环视图像数据,并提取相机BEV特征;雷达网络分支,用于获取雷达点云数据,并提取雷达BEV特征;历史特征时序融合模块,用于基于相机BEV特征提取时序融合相机BEV特征,基于雷达BEV特征提取时序融合雷达BEV特征;雷达‑相机特征交互注意力模块,用于将时序融合相机BEV特征和时序融合雷达BEV特征进行交互,得到交互后的相机BEV特征;融合检测头网络,用于基于交互后的相机BEV特征和时序融合雷达BEV特征,得到自动驾驶目标检测结果。该系统用于解决严重遮挡障碍物的问题,提高自动驾驶中目标检测的效果。
-
公开(公告)号:CN114639090B
公开(公告)日:2025-05-13
申请号:CN202111262855.8
申请日:2021-10-28
Applicant: 中国公路工程咨询集团有限公司 , 北京工业大学
IPC: G06V20/62 , G06V10/32 , G06V10/28 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/082
Abstract: 一种非可控环境下的鲁棒中文车牌识别方法属于图像处理领域,针对非可控环境下车牌识别存在的鲁棒性差、性能不高等问题。该方法基于CRNN框架实现,包括三个步骤:建立数据集、输入图像预处理和网络结构设计。由于中文车牌字符的长度不一,本发明采用了CTC算法,用于解决不定长车牌字符的对齐问题。CTC可以把从序列识别层获取的一系列字符序列转换成最终的字符序列。本发明效果:1、识别速度快、准确率高;2、可以实现任意定长车牌字符序列的识别,适应各种不同长度车牌的识别需求;3、泛化性较强,鲁棒性好,能够应用于各种复杂的非可控场景。
-
公开(公告)号:CN119579440A
公开(公告)日:2025-03-07
申请号:CN202411708317.0
申请日:2024-11-27
Applicant: 北京工业大学
Abstract: 一种基于小波注意力和VMamba网络的颜色恒常性方法属于计算机视觉和图像增强领域。该方法采用设计的WA‑VMamba网络进行光照参数估计,进而采用估计出的光照参数进行颜色校正,得到标准光照下的校正图像。本发明将设计的小波注意力机制嵌入到VMamba中,构建了一个深度网络模型(简称WA‑VMamba),使得利用该网络既能有效提取全局信息,又能兼顾局部信息,具有更强的特征提取与表达能力,有助于提升光照参数估计的准确性。
-
公开(公告)号:CN114037932B
公开(公告)日:2025-02-28
申请号:CN202111234339.4
申请日:2021-10-22
Applicant: 北京工业大学
IPC: G06V20/40 , G06V10/762 , G06V10/80 , G01S13/86
Abstract: 本发明提供一种交通异常事件检测方法、电子设备、存储介质和程序产品,方法包括获取交通视频数据和雷达数据;将交通视频数据的平均帧图像输入至车辆检测模型,进行可疑车辆检测,获得车辆检测模型输出的可疑车辆及其位置信息;对位置信息进行聚类处理,获得聚类结果,基于聚类结果判断可疑车辆是否为异常车辆;若可疑车辆为异常车辆,则基于聚类结果对位置信息进行过滤处理,获得异常车辆的目标位置信息,基于雷达数据和目标位置信息,进行决策级融合,获得异常车辆的异常事件类别。本发明占用更少的内存资源,可在终端设备上进行处理,无需在远程设备上进行处理,从而避免远程传输数据出现错检漏检的情况,进而提高交通异常事件检测的准确率。
-
公开(公告)号:CN119130898A
公开(公告)日:2024-12-13
申请号:CN202410985549.4
申请日:2024-07-22
Applicant: 首都医科大学附属北京友谊医院 , 北京工业大学
Abstract: 本申请提供一种蜗神经孔的处理方法、装置以及计算设备。确定目标颞骨区域扫描数据目标颞骨区域扫描数据将目标颞骨区域扫描数据输入预先训练好的耳蜗分割模型,以获取耳蜗分割掩膜;根据耳蜗分割掩膜调整耳蜗姿态,并根据耳蜗姿态确定耳蜗尺寸,根据耳蜗尺寸确定耳蜗裁剪模板并对初始颞骨区域扫描数据进行裁剪,以获取耳蜗及内听道视图;界定并提取内听道结构,并基于耳蜗姿态对应的蜗轴方向,对蜗神经孔视图和内听道结构进行旋转,蜗神经孔视图通过耳蜗及内听道视图分离得到;通过旋转后的蜗神经孔视图和内听道结构,以确定蜗神经孔是否狭窄。本申请提供的技术方案能够快速判断蜗神经孔是否存在狭窄,以提高诊断精度和效率。
-
公开(公告)号:CN113850818B
公开(公告)日:2024-11-01
申请号:CN202110992746.5
申请日:2021-08-27
Applicant: 北京工业大学
IPC: G06T7/11 , G06T7/13 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种混合2D和3D卷积神经网络的耳部CT影像前庭分割方法,包括构建数据集、基于多种深度特征融合策略的2DCNN分割网络设计以及3DDenseUNet分割网络设计三个步骤。2D网络采用编码器‑解码器结构作为主干网络提取耳部CT影像的前庭特征;然后整合DenseNet‑BC和U‑Net网络架构,搭建一个3DDenseUNet网络,融合低层空间信息和高层语义信息,最终实现前庭的精准分割。针对前庭结构设计的分割网络可以获得比通用的分割方法更优的分割性能,提高放射科医护人员的工作效率和质量。本发明能够准确进行耳部关键结构的自动分割,帮助医生完成大量重复性的工作,有效地减轻医生的负担。
-
公开(公告)号:CN114240994B
公开(公告)日:2024-07-19
申请号:CN202111302041.2
申请日:2021-11-04
Applicant: 北京工业大学
IPC: G06T7/246 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种目标跟踪方法、装置、电子设备及存储介质。其中,目标跟踪方法包括:获取初始特征图像;所述初始特征图像包括目标对象;将所述初始特征图像输入到分类及回归网络中,分别得到分类特征图像和回归特征图像;对所述分类特征图像和所述回归特征图像进行位置信息处理,得到位置特征图像;对所述位置特征图像进行相关性处理,得到相关特征图像;基于所述相关特征图像,得到所述目标对象的目标跟踪信息。本发明能够提高目标跟踪的精确度。
-
公开(公告)号:CN114037011B
公开(公告)日:2024-05-28
申请号:CN202111316442.3
申请日:2021-11-08
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/774 , G06F17/16 , G06F17/18
Abstract: 本发明公开了一种中医舌色噪声标注样本的自动识别与清洗方法,通过对比预测标签与人工标注标签的概率关系,采用两种不同的筛选策略,实现对舌色噪声标注数据的准确、自动识别与清洗。本发明将人工标注标签称为硬标签,将通过模型得到的标签预测概率称为软标签,将预测概率最大值对应的标签称为伪标签。本发明利用深度网络模型进行样本标签的预测,进而进行噪声样本的自动识别和筛选,结果更加客观、准确。另外,整个过程没有专家的参与,不需要耗费人力,同时降低了人为带来噪声的可能性,提高了噪声标注样本识别的准确率;在模型训练前进行数据集的处理,使得处理后的数据集可以适用于其他分类模型。
-
公开(公告)号:CN113850760B
公开(公告)日:2024-05-28
申请号:CN202110998724.X
申请日:2021-08-27
Applicant: 北京工业大学
IPC: G06T7/00 , G06T7/11 , G06V10/774 , G06F17/16
Abstract: 一种耳部CT影像前庭检测方法属于计算机视觉和医学影像处理领域。首先,专门设计了一个专用的前庭分割网络,可以进行前庭的准确分割。然后基于前庭分割结果,采用主成分分析算法进行前庭横径的自动测量。本发明设计了一种专用的分割网络,对前庭结构进行准确分割和检测。
-
公开(公告)号:CN113516058B
公开(公告)日:2024-05-24
申请号:CN202110680032.0
申请日:2021-06-18
Applicant: 北京工业大学
Abstract: 本发明涉及一种直播视频群组异常活动检测方法、装置、电子设备及介质,该方法包括使用卷积神经网络提取直播视频帧序列中个体的深度时空特征,并使用FPN和PAN网络对直播视频帧序列中的个体进行定位,以得到位置参数;将个体的深度时空特征和位置参数作为输入以构建图卷积模块,从而提取群组活动关系,并利用图卷积模块对时间上下文信息进行编码,以得到不同时间尺度的群组活动码字;将不同时间尺度的群组活动码字与已知类别的群组活动码字进行匹配,以判定是否发生群组异常活动和/或发生群组异常活动的时间段。本发明通过提取深度时空特征和定位,以及进行时间上下文编码,可以提高群组异常活动检测的速度和准确度,降低检测的成本。
-
-
-
-
-
-
-
-
-