-
-
公开(公告)号:CN110135499A
公开(公告)日:2019-08-16
申请号:CN201910410873.2
申请日:2019-05-16
Applicant: 北京工业大学
Abstract: 一种基于流形空间的自适应邻域图学习的聚类方法,针对图像和视频等具有复杂非线性结构的多维数据,传统的谱聚类方法利用拉普拉斯约束学习数据间的相似性,容易造成错误解释数据全局结构的问题,在Grassmann流形上建立基于自表达的统一框架后引入自适应邻域正则化,从而来提高对视频或图像集多维数据的聚类性能。本发明涉及流形学习,模式识别和机器学习等领域,面向图像和视频高维数据的多视聚类效果显著优于其他经典聚类方法,有效提升了识别能力。
-
公开(公告)号:CN107704887A
公开(公告)日:2018-02-16
申请号:CN201710982686.2
申请日:2017-10-20
Applicant: 北京工业大学
CPC classification number: G06K9/6267 , G06T3/0031
Abstract: 本发明公开一种基于F范数的局部保持投影的图像识别方法,用于对高维数据提取特征,降维以及图像中存在异常值的情况,记为FLPP。方法包括:输入原始的图像数据,并确定在F范数下的目标函数;利用交替迭代法对获得的F范数的目标函数求解,得到投影矩阵;利用投影矩阵对图像进行分类。与传统的LPP方法不同的是,本方法通过引入F范数测量数据间的距离,求解投影矩阵,使距离相近的数据在投影到低维空间中仍保持相近;此外,使用F范数能保证在求解时不受异常值的影响。本发明可广泛应用于图像识别领域。
-
公开(公告)号:CN105679022A
公开(公告)日:2016-06-15
申请号:CN201610080557.X
申请日:2016-02-04
Applicant: 北京工业大学
IPC: G08G1/01
CPC classification number: G08G1/0125
Abstract: 本发明公开了一种基于低秩的多源交通数据的补全方法,其能够使得补全的数据的精准度在数据丢失率较大时大幅提高。该方法包括步骤:(1)从多源交通数据中构造数据矩阵;(2)分别计算每种交通数据矩阵的低秩表示;(3)约束每个矩阵的低秩表示彼此之间相似。
-
-
公开(公告)号:CN120012895A
公开(公告)日:2025-05-16
申请号:CN202510487218.2
申请日:2025-04-18
Applicant: 北京工业大学
IPC: G06N5/022 , G06F40/194 , G06F40/258 , G06F40/30
Abstract: 本发明公开了一种多模态知识图谱补全方法,属于知识图谱和人工智能领域。该方法通过构建多个功能模块,在数据、特征、分布层面实现多模态语义对齐,有效解决模态间语义不一致、特征空间差异和噪声干扰等问题,提升多模态知识图谱补全模型性能,在链接预测任务中显著提高补全的准确性和可解释性。
-
公开(公告)号:CN119202212B
公开(公告)日:2025-02-11
申请号:CN202411730037.X
申请日:2024-11-29
Applicant: 北京工业大学
IPC: G06F16/3329 , G06V30/148 , G06V30/19
Abstract: 本发明公开了一种基于对偶反事实的视觉问答去偏方法,涉及计算机视觉领域,分别用遮盖关键视觉区域的视觉反事实样本和遮盖关键词的问题反事实样本作为共享同一组参数的偏见模型的输入,同时从两个角度捕捉语言偏见本发明利用偏见模型的偏见预测生成伪标签,结合边际损失分离不同答案样本的特征空间,最大程度降低语言偏见对目标视觉问答模型的影响。
-
公开(公告)号:CN112307980B
公开(公告)日:2024-12-13
申请号:CN202011199557.4
申请日:2020-10-28
Applicant: 北京工业大学
IPC: G06V10/764 , G06V10/762
Abstract: 本发明涉及一种基于不完整多视聚类的图像识别方法,用于解决图像分类识别问题,属于模式识别和机器学习领域,尤其是面向图像数据的不完整多视角聚类任务。本方法从以下两个方面进行分析:1)多个graph模型对同一图像样本从不同角度描述,将其共享的一致性信息最大化;2)每个视角具有其他视角所不具有的个性化信息,有效利用这些固有的差异来进行聚类。具体的,本方法对于由不同特征所描述的不完整多视角图像数据集,构造每个视角下的初始图模型,用指示矩阵标记丢失图像的位置,提取关联矩阵从而实现不完整多视数据的聚类任务,从而有效提升图像识别的准确性与鲁棒性。
-
公开(公告)号:CN113918722B
公开(公告)日:2024-08-02
申请号:CN202111343981.6
申请日:2021-11-14
Applicant: 北京工业大学
IPC: G06F16/35 , G06F18/2136 , G06F18/23213 , G06N3/042 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了面向引文网络数据的基于稀疏图学习的图卷积聚类方法,该方法在图卷积网络的每个图卷积层前面嵌入了一个稀疏图结构学习层,挖掘高维数据中的低维结构从而构建更优的图结构。在模型优化时,交替更新图结构和节点表示,减少不准确的图结构对图卷积网络带来的负影响,最终对得到的节点表示执行K‑Means获得最终的聚类结果。相比于现有的固定图结构的图卷积深度聚类方法,不断更新的图结构对边攻击更加鲁棒。本发明从节点表示中学习自适应图来提高原始图结构的质量。所使用的持续更新的图结构可以有效地帮助生成更全面和更具有判别性的节点特征。最后,逐层交替的更新图结构和节点表示可以有效缓解图卷积网络中过平滑的问题。
-
公开(公告)号:CN111461257B
公开(公告)日:2024-05-28
申请号:CN202010337201.6
申请日:2020-04-24
Applicant: 北京工业大学
IPC: G06V10/762
Abstract: 本发明公开了一种基于乘积Grassmann流形的多视点视频数据的共享‑差异表示(PGM‑CER)聚类分析方法,用于解决传统多视聚类方法无法将多视数据中的共享和差异信息分离开来、不适用于具有复杂非线性结构的多维数据的问题。本方法中,聚类过程分为三部分,首先,用乘积Grassmann流形来表示多视点视频,再将共享‑差异表示从欧氏空间扩展到乘积Grassmann流形空间;然后,建立PGM‑CER模型,在全局约束下学习其共享‑差异信息;最终,实现多视点视频聚类。直接求解流形上的优化问题比较困难,本方法通过流形空间与欧氏空间的映射求解最优解,简化了学习过程,效果显著优于其他经典多视聚类方法。
-
-
-
-
-
-
-
-
-