-
公开(公告)号:CN114037879A
公开(公告)日:2022-02-11
申请号:CN202111237748.X
申请日:2021-10-22
Applicant: 北京工业大学
IPC: G06V10/772 , G06V10/774 , G06K9/62 , G06N20/00
Abstract: 公开一种面向零样本识别的字典学习方法及装置,可以从类别层面和图像层面分别建立视觉空间和语义空间之间的对齐,从而实现高精度的零样本图像识别。方法包括:(1)基于跨域字典学习方法训练类别层的跨域字典;(2)基于步骤(1)学习的类别层跨域字典生成图像的语义属性;(3)基于步骤(2)生成的图像语义属性训练图像层的跨域字典;(4)基于步骤(3)学习的图像层跨域字典完成对不可见类别图像的识别任务。
-
公开(公告)号:CN110232698B
公开(公告)日:2021-09-17
申请号:CN201910320609.X
申请日:2019-04-20
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于模型分割与L1中值骨架的连续帧三维人体曲线骨架提取方法,本发明借助基于模型分割点的插值骨架对L1中值骨架进行去噪与修复,进而通过迭代优化,来求解考虑了运动关联的时间约束和骨骼块间及块内的空间约束的骨骼点序列,各帧内骨骼点相互连接形成完整的骨架。该方法包含以下三个步骤:基于L1中值骨架提取方法的L1中值骨架提取,基于模型分割骨架TPS变形的L1中值骨架去噪与补全,连续帧曲线骨架序列优化。此方法可以在几乎没有人工干预的情况下面向连续帧网格模型提取出更准确、更完整、更平滑的三维人体曲线骨架。
-
公开(公告)号:CN109829449B
公开(公告)日:2021-09-14
申请号:CN201910174110.2
申请日:2019-03-08
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于超像素时空上下文的RGB‑D室内场景标注方法,在计算机视觉领域,将数字图像细分为多个图像子区域的过程称为超像素分割。超像素通常是由一系列位置相邻且颜色、亮度、纹理等特征相似的像素点组成的小区域,这些小区域保留了局部有效信息,且一般不会破坏图像中物体的边界信息。本方法中以0.08阈值确定的超像素的语义标注为优化目标,以0.06分割阈值确定的超像素作为空间上下文,用于优化语义标注结果。对叶节点以及中间节点对应的每一块超像素进行语义分类,得到0.06和0.08阈值下的超像素分割图中每一超像素语义标注概率。本发明显著优于现有常规室内场景标注方法。
-
公开(公告)号:CN108564047B
公开(公告)日:2021-09-10
申请号:CN201810352501.4
申请日:2018-04-19
Applicant: 北京工业大学
Abstract: 本发明公开一种基于3D关节点序列的行为识别方法,对给定的人体运动序列,包括以下步骤:步骤1、提取基于运动引导的关节点帧内偏移和帧间偏移;步骤2、通过偏移特征集合的聚类中心将其转换为由“视觉单词”组成的码本,并聚集所有的码本与偏移向量的差获得一个高维的特征向量;步骤3、基于融合特征分析模型的监督哈希映射生成哈希编码,并采用K最近邻进行分类。
-
公开(公告)号:CN112836000A
公开(公告)日:2021-05-25
申请号:CN202110120448.7
申请日:2021-01-28
Applicant: 北京工业大学
IPC: G06F16/29 , G06F16/9537 , G06F16/909 , G06F17/16
Abstract: 基于出租车OD数据的非常态居民出行模式挖掘方法属于智能交通和数据挖掘领域。为了能够更好的挖掘出租车乘客出行规律,同时更深入的挖掘居民出行中存在的非常态模式,本发明提出了一种基于高维度稀疏张量分解的方法,即通过组织包括时间、经纬度、功能区属性等多维度信息为张量模型,对其进行低秩稀疏分解。为此,需要解决的关键技术问题包括:对研究区域划分功能区并把对应数据归到相应功能区内;组织时间、经纬度、功能区属性等对应数据构成张量模型;对张量模型做低秩稀疏分解,分别提取低秩模型和稀疏模型并做Tucker分解;对分解得到的基底矩阵做可视化,直观的展现乘客出行模式。
-
公开(公告)号:CN112801386A
公开(公告)日:2021-05-14
申请号:CN202110153458.0
申请日:2021-02-04
Applicant: 北京工业大学
Abstract: 一种基于三阶段模型的短时交通流预测方法属于智能交通系统领域,本发明提出了VMD‑GCN‑GRU模型,实现对交通数据的短时预测。与现有的短时交通流预测方法相比,通过对路网交通数据进行变分模态分解(Var i at i ona lMode Decompos it i on,VMD),可以削弱大部分噪声,有效降低原始信号的非平稳性,分解得到多组本征模态函数(I ntr i ns i c Mode Funct i on,I MF)和残差,把分解后的具有相似中心频率的I MF和残差依次输入GCN与GRU模型中进行预测,将得到的预测结果进行重构,从而得到最终的预测结果。实验表明,基于VMD‑GCN‑GRU模型的预测精度相比于其它深度学习预测方法有了较大的提升。
-
公开(公告)号:CN111126218A
公开(公告)日:2020-05-08
申请号:CN201911288489.6
申请日:2019-12-12
Applicant: 北京工业大学
Abstract: 公开一种基于零样本学习的人体行为识别方法,其提高了所训练分类器的分类性能和准确率,推进了人体行为类别自动标注目标的实现。该方法包括:(1)基于动作类与动作关联物体构造知识图谱,并通过基于注意力机制的图卷积网络AMGCN动态更新其关系,旨在更好地描述图中节点的关系;(2)学习基于梯度惩罚和循环一致性约束的生成对抗网络WGAN-GCC,使得学习的生成器能够更好地生成未知类特征;(3)将图卷积网络和生成对抗网络两个网络结合为双流深度神经网络,使得训练的分类器更具判别性。
-
公开(公告)号:CN110232698A
公开(公告)日:2019-09-13
申请号:CN201910320609.X
申请日:2019-04-20
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于模型分割与L1中值骨架的连续帧三维人体曲线骨架提取方法,本发明借助基于模型分割点的插值骨架对L1中值骨架进行去噪与修复,进而通过迭代优化,来求解考虑了运动关联的时间约束和骨骼块间及块内的空间约束的骨骼点序列,各帧内骨骼点相互连接形成完整的骨架。该方法包含以下三个步骤:基于L1中值骨架提取方法的L1中值骨架提取,基于模型分割骨架TPS变形的L1中值骨架去噪与补全,连续帧曲线骨架序列优化。此方法可以在几乎没有人工干预的情况下面向连续帧网格模型提取出更准确、更完整、更平滑的三维人体曲线骨架。
-
公开(公告)号:CN110096961A
公开(公告)日:2019-08-06
申请号:CN201910269599.1
申请日:2019-04-04
Applicant: 北京工业大学
Abstract: 公开一种超像素级别的室内场景语义标注方法,其能够避免深度网络应用于像素级室内场景标注计算成本巨大的问题,而且能够使深度网络接受超像素集合作为输入。这种超像素级别的室内场景语义标注方法,包括以下步骤:(1)使用简单线性迭代聚类分割算法对室内场景彩色图像进行超像素分割;(2)结合室内场景深度图像对步骤(1)获得的超像素,提取超像素核描述子特征(初级特征);(3)构建超像素的邻域;(4)构建超像素深度网络SuperPixelNet,学习超像素多模态特征;对待标注超像素,结合该超像素及其邻域超像素的多模态特征,对室内场景RGB-D图像给出超像素级语义标注。
-
公开(公告)号:CN109829972A
公开(公告)日:2019-05-31
申请号:CN201910056962.1
申请日:2019-01-19
Applicant: 北京工业大学
Abstract: 本发明公开了一种面向连续帧点云的三维人体标准骨架提取方法,该方法包含以下两个步骤:第一步,采集多视角运动人体的图像,使用每一帧的各视角图像重建出稠密的点云模型。针对每一帧的点云模型,进行降采样,表面重建,进而使用基于模型分割的三维人体标准骨架提取算法提取标准骨架模型;第二步,对提取的标准骨架进行帧间对齐与对应点匹配,构造连续帧标准骨架的骨骼点序列,建立连续帧骨骼点位置优化模型对上面得到的骨骼点序列进行优化,最终得到面向连续帧点云的三维人体标准骨架序列在几乎没有人工干预的前提下,提取的三维人体骨架无论是在完整性上,与原模型贴合度上,准确性上,还是在标准性上都比传统方法提取的骨架更具有优势,更具有实用价值与意义。
-
-
-
-
-
-
-
-
-