-
公开(公告)号:CN116402888A
公开(公告)日:2023-07-07
申请号:CN202310305086.8
申请日:2023-03-27
申请人: 北京工业大学 , 北京钢铁侠科技有限公司
摘要: 本发明公开了一种形状约束联合向量筛选的刚性物体6D位姿估计方法,可有效提高6D位姿估计精度。本发明定义一种用于描述图像中物体形状。本发明利用不同2D关键点之间的几何关系辅助2D关键点定位。同时在任意选取两个向量计算假设关键点时,现有技术不考虑所用向量的合理性,导致生成的假设关键点的位置偏差较大,本发明提出向量筛选策略,阻止不合理的向量计算假设关键点,从而减小假设关键点的位置偏差,最终提高位姿估计的性能。
-
公开(公告)号:CN112699892B
公开(公告)日:2024-11-08
申请号:CN202110026447.6
申请日:2021-01-08
申请人: 北京工业大学
IPC分类号: G06V20/70 , G06V10/26 , G06V10/82 , G06V10/44 , G06V10/74 , G06V10/774 , G06N3/088 , G06N3/0895 , G06N3/09 , G06N3/084 , G06N3/0464
摘要: 本发明公开了一种无监督领域自适应语义分割方法,基于源域图像训练神经网络;利用已训练网络计算目标域图像伪标签;利用源域图像和有伪标签的目标域图像重训练网络,进一步提高伪标签准确性,优化网络的泛化能力。本方法通过利用自训练方法,利用已训练网络提取高置信度的目标域伪标签,弥补了目标域缺少监督信息的缺点,与其他方法相比,丰富了目标域数据的信息,提升网络对目标域数据的学习能力;本方法着重考虑了基于类别的域间差异,针对源域和目标域的预测进行类相关性度量,约束两个域的类相关性一致,减小了两个域类级别的域间差异,提高了网络的泛化能力,本发明的性能优于其他无监督领域自适应语义分割方法。
-
公开(公告)号:CN113239824B
公开(公告)日:2024-04-05
申请号:CN202110544122.7
申请日:2021-05-19
申请人: 北京工业大学
IPC分类号: G06V40/20 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本发明涉及一种基于3D‑Ghost模块的多模态训练单模态测试的动态手势识别方法,用于解决多模态训练单模态测试的动态手势识别问题,具体利用RGB数据和深度数据训练整体网络,整体网络采用并行双通道协作学习的结构,旨在通过不同模态网络之间传递知识来改善学习过程,通道m用于通过RGB数据识别动态手势,通道n用于通过深度数据识别动态手势;训练完成后,将RGB数据输入通道m进行动态手势识别,或者将深度数据输入通道n进行动态手势识别;其中通道采用I3D网络并对其进行改进,改进之处在于增加了注意力模块,部分3D卷积层替换为3D‑Ghost模块,对所有Inception‑V1子模块进行改进。
-
公开(公告)号:CN109993825B
公开(公告)日:2023-06-20
申请号:CN201910179121.X
申请日:2019-03-11
申请人: 北京工业大学
IPC分类号: G06T17/00 , G06N3/0475 , G06N3/094 , G06N3/0464 , G06N3/0455
摘要: 公开一种基于深度学习的三维重建方法,该方法包括:(1)将输入图像被约束的潜在向量重建出目标完整三维形状,学习部分和完整三维形状之间的映射,然后实现单幅深度图像的三维重建;(2)学习三维真实对象与重建对象之间的中间特征表示,从而获得步骤(1)中的目标潜在变量;(3)利用极限学习机将步骤(1)中预测的体素浮动值变换为二进制值,完成高精度重建。
-
公开(公告)号:CN115393661A
公开(公告)日:2022-11-25
申请号:CN202211008807.0
申请日:2022-08-22
申请人: 北京工业大学
摘要: 一种用于场景图生成的自适应上下文建模方法及装置,可以根据场景内容自适应地序列化其中的物体,从而改善生成的场景图的效果。方法包括:(1)使用经过预训练的目标检测器对输入图像进行目标检测,输出一系列物体提议,选择置信度较高的前80个,将其视为该场景中存在的物体;(2)将细化后的语义标签映射为200维的向量表示,然后将其与物体的视觉特征以及上下文特征拼接起来作为物体的完整特征表示,将图像中n个物体的特征O分别输入物体选择位置分支和位置选择物体分支,衡量物体与其在链式结构中的位置的匹配程度,计算得到物体与位置的匹配分数矩阵,对物体的序列化问题看作指派问题来求解;(3)上下文信息融合以及关系预测。
-
公开(公告)号:CN114037879A
公开(公告)日:2022-02-11
申请号:CN202111237748.X
申请日:2021-10-22
申请人: 北京工业大学
IPC分类号: G06V10/772 , G06V10/774 , G06K9/62 , G06N20/00
摘要: 公开一种面向零样本识别的字典学习方法及装置,可以从类别层面和图像层面分别建立视觉空间和语义空间之间的对齐,从而实现高精度的零样本图像识别。方法包括:(1)基于跨域字典学习方法训练类别层的跨域字典;(2)基于步骤(1)学习的类别层跨域字典生成图像的语义属性;(3)基于步骤(2)生成的图像语义属性训练图像层的跨域字典;(4)基于步骤(3)学习的图像层跨域字典完成对不可见类别图像的识别任务。
-
公开(公告)号:CN109829449B
公开(公告)日:2021-09-14
申请号:CN201910174110.2
申请日:2019-03-08
申请人: 北京工业大学
摘要: 本发明公开了一种基于超像素时空上下文的RGB‑D室内场景标注方法,在计算机视觉领域,将数字图像细分为多个图像子区域的过程称为超像素分割。超像素通常是由一系列位置相邻且颜色、亮度、纹理等特征相似的像素点组成的小区域,这些小区域保留了局部有效信息,且一般不会破坏图像中物体的边界信息。本方法中以0.08阈值确定的超像素的语义标注为优化目标,以0.06分割阈值确定的超像素作为空间上下文,用于优化语义标注结果。对叶节点以及中间节点对应的每一块超像素进行语义分类,得到0.06和0.08阈值下的超像素分割图中每一超像素语义标注概率。本发明显著优于现有常规室内场景标注方法。
-
公开(公告)号:CN108564047B
公开(公告)日:2021-09-10
申请号:CN201810352501.4
申请日:2018-04-19
申请人: 北京工业大学
摘要: 本发明公开一种基于3D关节点序列的行为识别方法,对给定的人体运动序列,包括以下步骤:步骤1、提取基于运动引导的关节点帧内偏移和帧间偏移;步骤2、通过偏移特征集合的聚类中心将其转换为由“视觉单词”组成的码本,并聚集所有的码本与偏移向量的差获得一个高维的特征向量;步骤3、基于融合特征分析模型的监督哈希映射生成哈希编码,并采用K最近邻进行分类。
-
公开(公告)号:CN107944428B
公开(公告)日:2021-07-30
申请号:CN201711345653.3
申请日:2017-12-15
申请人: 北京工业大学
摘要: 一种基于超像素集的室内场景语义标注方法属于多媒体技术与计算机图形学技术领域,针对基于超像素特征或像素特征进行室内场景语义标注方法的语义特征提取自小尺度空间的局限。本发明先计算超像素特征,然后利用高斯混合模型基于超像素特征建模超像素集特征,并将其映射到希尔伯特空间,最后降维到欧式空间得到超像素集的特征表示。与以往方法不同,本发明针对与物体对象基本等量的空间(超像素集)提取特征,能更准确地表征物体对象以达到提高室内场景语义标注准确率的目标。
-
公开(公告)号:CN112836000A
公开(公告)日:2021-05-25
申请号:CN202110120448.7
申请日:2021-01-28
申请人: 北京工业大学
IPC分类号: G06F16/29 , G06F16/9537 , G06F16/909 , G06F17/16
摘要: 基于出租车OD数据的非常态居民出行模式挖掘方法属于智能交通和数据挖掘领域。为了能够更好的挖掘出租车乘客出行规律,同时更深入的挖掘居民出行中存在的非常态模式,本发明提出了一种基于高维度稀疏张量分解的方法,即通过组织包括时间、经纬度、功能区属性等多维度信息为张量模型,对其进行低秩稀疏分解。为此,需要解决的关键技术问题包括:对研究区域划分功能区并把对应数据归到相应功能区内;组织时间、经纬度、功能区属性等对应数据构成张量模型;对张量模型做低秩稀疏分解,分别提取低秩模型和稀疏模型并做Tucker分解;对分解得到的基底矩阵做可视化,直观的展现乘客出行模式。
-
-
-
-
-
-
-
-
-