-
公开(公告)号:CN113011322A
公开(公告)日:2021-06-22
申请号:CN202110286753.3
申请日:2021-03-17
申请人: 南京工业大学 , 贵州安防工程技术研究中心有限公司
摘要: 本发明公开了一种监控视频特定异常行为的检测模型训练方法及检测方法,属于视频处理技术领域。在训练模型时,包括:将数据集中每个训练视频均分成数量相等的视频片段,构成正例包和负例包;将视频片段输入预训练好的特征提取网络提取视频特征;将所提取的视频特征输入串联的至少一个全连接层,得到视频片段特征;利用所得到的视频片段特征构造无向图,将无向图输入串联的至少一个图卷积神经网络层得到异常得分;根据异常得分,计算正负样本之间的排序损失,并更新权重,完成至少一个全连接层和至少一个图卷积神经网路层的训练。检测时,利用所训练出的模型进行检测。本发明能够对视频监控中特定异常行为进行较好的检测,并具有较快的检测速度。
-
公开(公告)号:CN113011322B
公开(公告)日:2023-09-05
申请号:CN202110286753.3
申请日:2021-03-17
申请人: 贵州安防工程技术研究中心有限公司 , 南京工业大学
IPC分类号: G06V20/40 , G06V20/52 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明公开了一种监控视频特定异常行为的检测模型训练方法及检测方法,属于视频处理技术领域。在训练模型时,包括:将数据集中每个训练视频均分成数量相等的视频片段,构成正例包和负例包;将视频片段输入预训练好的特征提取网络提取视频特征;将所提取的视频特征输入串联的至少一个全连接层,得到视频片段特征;利用所得到的视频片段特征构造无向图,将无向图输入串联的至少一个图卷积神经网络层得到异常得分;根据异常得分,计算正负样本之间的排序损失,并更新权重,完成至少一个全连接层和至少一个图卷积神经网路层的训练。检测时,利用所训练出的模型进行检测。本发明能够对视频监控中特定异常行为进行较好的检测,并具有较快的检测速度。
-
公开(公告)号:CN117952956A
公开(公告)日:2024-04-30
申请号:CN202410264765.X
申请日:2024-03-08
申请人: 南京工业大学
IPC分类号: G06T7/00 , B23K9/095 , G06V10/44 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/084 , G06N3/096 , G06N3/045 , G06N3/0464
摘要: 本发明公开了一种基于对数似然估计的焊缝熔深预测方法,包括制备正面与背面图像焊接熔池图像数据集;制备熔宽回归标签与分类标签;构建基于深度学习的焊缝熔深分类模型与回归模型;两个模型的网络骨干相同;使用正面图像和分类标签训练焊缝熔深分类模型,采用梯度下降算法最小化交叉熵损失迭代更新网络模型得到网络骨干的预训练权重参数;使用正面图像和回归标签训练加载预训练权重的回归模型,采用对数似然的概念定义焊缝熔深预测任务的损失函数得到训练后的权重参数;将正面图像输入加载训练后的权重参数的回归模型得到熔池深度。本发明可应用于各种回归模型,在不增加额外模型参数推理时间的基础上,提高焊缝熔深预测任务中熔深的预测精度。
-
公开(公告)号:CN112257513B
公开(公告)日:2023-07-25
申请号:CN202011032048.2
申请日:2020-09-27
申请人: 南京工业大学
IPC分类号: G06V40/20 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种手语视频翻译模型的训练方法、翻译方法及系统,属于模式识别与智能系统领域。本发明首先对孤立词数据集中的手语视频数据进行预处理,提取手语视频中人物区域,并利用Mask R‑CNN网络模型对运动的手部进行检测和跟踪,使用第一网络模块提取手部特征,使用第二网络模块提取人体特征;将所提取的手部特征与人体特征利用全连接层进行特征信息融合,训练得到孤立词的权重模型;将所得到孤立词的权重模型作为第三网络模块的预训练模型,并利用第三网络模块对连续语句视频进行特征提取;将提取结果,输入Seq2Seq模型中进行训练,得到训练好的手语视频翻译模型,并进一步地提出了翻译方法和系统架构。本发明对手语视频翻译的效果好,准确率高。
-
公开(公告)号:CN115601591A
公开(公告)日:2023-01-13
申请号:CN202211256342.0
申请日:2022-10-13
申请人: 南京工业大学(CN)
IPC分类号: G06V10/764 , G06V10/77 , G06V10/774
摘要: 本发明公开了基于自适应局部序数保持解析字典学习的图像分类方法,属于计算机视觉技术领域,该方法包括:对数据集中的图像进行特征提取,将其划分为训练集和测试集,并基于训练集采用支持自适应局部序数保持的解析字典学习模型同时学习解析字典和分类器,然后基于学习所得的解析字典计算测试集的编码系数,最后通过分类器与测试集的编码系数取得测试集的类别标签。本发明方法在判别式卷积解析字典学习模型基础上引入一个自适应序数局部保持项,通过在学习过程中同时保持字典原子之间的邻域相关性和邻域内原子的距离排序信息,优化解析字典学习模型,以增强字典的判别性,提升模型在人脸识别、物体识别和场景识别等一般场景下的图像分类准确率。
-
公开(公告)号:CN114943862A
公开(公告)日:2022-08-26
申请号:CN202210637417.3
申请日:2022-06-07
申请人: 南京工业大学
IPC分类号: G06V10/764 , G06V10/774 , G06V10/46
摘要: 本发明公开了一种基于结构性解析字典学习的两阶段图像分类方法,该方法属于计算机视觉技术领域。该方法包括:(1)特征提取:对原始图像数据进行特征提取,构建训练集和测试集;(2)阶段1:基于训练集采用结构性解析字典学习模型训练解析字典及投影矩阵;(3)阶段2:基于训练样本的结构化稀疏表示系数,训练支持向量机(SVM)分类器;(4)分类测试:在测试集上利用训练好的解析字典和支持向量机,使用多元支持向量机分类算法实现分类功能,得到分类结果。本发明简化了结构性解析字典学习(SADL)模型,并将分类器学习过程和字典学习过程分离,使用支持向量机代替原本的线性分类器,从而提出了基于结构性解析字典学习两阶段图像分类方法。本发明方法适用于一般情况下的图像分类问题,在人脸识别、场景识别、物体识别上的分类准确率均能超过原算法。
-
公开(公告)号:CN112233086A
公开(公告)日:2021-01-15
申请号:CN202011095774.9
申请日:2020-10-14
申请人: 南京工业大学
摘要: 本发明设计了一种基于脑区功能连接的fMRI数据分类识别方法及装置,包括:获取被试者fMRI数据;对所获取的fMRI数据进行预处理,得到大脑灰质图像;将大脑灰质图像分割成多个不同功能的脑区,并提取每个脑区的平均体素时间序列;基于模糊决策粗糙集从多个功能脑区中选择存在显著差异的部分脑区;基于选择出的部分脑区,计算不同脑区之间的皮尔森相关系数,并采用Fisher‑z变换对系数进行非线性处理,得到部分脑区的功能连接矩阵;对矩阵中的相关系数值进行稀疏化,保留阈值之上的相关系数值,并将矩阵展开成一维特征向量;将得到的一维特征向量作为输入送到训练好的SVM识别模型中,得到被试者的输出标签并判断被试者fMRI数据类别。
-
公开(公告)号:CN109357630A
公开(公告)日:2019-02-19
申请号:CN201811273893.1
申请日:2018-10-30
申请人: 南京工业大学
IPC分类号: G01B11/24
摘要: 本发明提供了一种多类型工件批量视觉测量系统及方法,属于工业检测自动化领域。本发明的测量系统由包括数据处理终端、工件检测单元、图像获取单元、和控制单元等部分组成。本发明的测量方法包括判断待测工件是否放入检测平台,获得局部深度图像,获得全局图像,识别工件种类及数量,完成测量任务所要求尺寸参数测量等步骤。本发明能够同时对多种类、多数量工件同时检测,相较于传统测量手段,在测量工件类型、数量、速度和精度等方面都有显著提高。
-
公开(公告)号:CN104700120B
公开(公告)日:2018-11-13
申请号:CN201510132205.X
申请日:2015-03-23
申请人: 南京工业大学
摘要: 本发明公开了一种基于自适应熵投影聚类算法的fMRI特征提取及分类方法。该方法首先采用滑动时间窗方法构建动态功能连接矩阵,然后运用自适应熵的投影聚类算法(Adaptive Entropy Algorithm for Projective Clustering,AEPC)分别对甲类和乙类试验参与者的动态功能连接矩阵聚类,形成多个聚类中心,随后计算每个试验参与者的功能连接矩阵与每个聚类中心的相似性构成相似性矩阵,最后提取相似性矩阵中的元素作为特征,训练SVM分类器对脑部数据进行分类。本发明不仅提高了数据分类模型的泛化能力,而且可以提取丰富的脑部动态结构信息,并可应用于生物信息技术的研究中自动处理与分类脑部数据。
-
公开(公告)号:CN105894702B
公开(公告)日:2018-01-16
申请号:CN201610449982.1
申请日:2016-06-21
申请人: 南京工业大学 , 泰州市远东高科自动化工程有限公司
IPC分类号: G08B13/196 , H04N7/18
摘要: 本发明公开了一种基于多摄像机数据融合的入侵检测报警系统及其检测方法,属于视频监控技术领域。本发明的系统包括普通摄像机、云台摄像机、变焦广角多目标追踪系统、PC式硬盘录像机、控制系统、显示器、多级告警处理模块、侵入物识别及处理模块,利用多个摄像机全范围覆盖所需监控区域,将拍摄到的视频信号数字化和压缩后传递给控制系统,对侵入物进行识别处理,并响应对应告警等级。本发明适应于对安全生产要求比较高的场景或通道,如厂区、隧道、仓库、机场等场所,可进行不同情况下的监控和报警。
-
-
-
-
-
-
-
-
-