基于深度网络的图标检测方法

    公开(公告)号:CN109800698A

    公开(公告)日:2019-05-24

    申请号:CN201910026888.9

    申请日:2019-01-11

    Abstract: 本公开涉及一种基于深度学习的图标检测方法,包括模型训练阶段和模型测试阶段,其中,所述模型训练阶段包括以下步骤:步骤1、准备画面中不含待检测图标的视频帧集合;步骤2、准备仅含有待检测图标的图标图像,其包含颜色通道和Alpha通道数据、以及图标分类信息;步骤3、将所述图标图像与视频帧集合中的各个帧进行随机的图像叠加,形成含有待检测图标的叠加图像,作为训练数据集,训练形成图标检测模型;其中,所述模型测试阶段包括以下步骤:步骤4、将待检测图像输入所述图标检测模型,所述图标检测模型输出检测结果,所述检测结果包括所述测试图像是否含有图标、所含图标的分类信息和位置信息。

    一种基于CNN和LSTM的暴恐视频检测方法

    公开(公告)号:CN105844239B

    公开(公告)日:2019-03-29

    申请号:CN201610168334.9

    申请日:2016-03-23

    Abstract: 本发明公开了一种基于CNN和LSTM的暴恐视频检测方法,属于模式识别、视频检测、深度学习技术领域。所述检测方法首先对待检测视频进行关键帧采样,并提取关键帧特征;然后进行视频层面的表达与判别,包括CNN语义模块的VLAD特征表达与SVM判别、CNN场景模块的场景VLAD特征表达与SVM判别,以及LSTM时序模块的LSTM判别;最后进行结果融合。本发明利用了CNN在图像特征提取和LSTM在时序序列表达方面的优势,并充分考虑暴恐视频在场景方面的特色,实际测试中检测指标mAP值达到98.0%,接近人工作业水准。在运行速度方面,仅采用单机GPU加速的方式,每秒钟便可以处理76.4秒的网络视频,适于阻断暴恐视频在大型视频网站上的传播,有利于维护社会稳定和国家长治久安。

    爆炸电路板残片图像自动比对识别方法

    公开(公告)号:CN106780440A

    公开(公告)日:2017-05-31

    申请号:CN201611075728.6

    申请日:2016-11-29

    CPC classification number: G06T7/0004 G06T2207/30141

    Abstract: 本发明公开了一种爆炸电路板残片图像自动比对识别方法,属于模式识别和图像处理技术领域。所述方法首先将残片图像基于概率图模型的图像分割算法进行对象分割,再采用基于概率抽样的颜色模型进行元器件的对象精定位,然后提取特征点并过滤,将过滤后的特征点与检索库中的电路板特征点进行比对识别,确定残片所属的源电路板。本发明首次提出并实现了根据爆炸电路板残片图像自动识别印刷电路板同型号原板的方法。所述比对识别方法能够准确地分割出电路板中的元器件及字符区域,抑制噪声干扰,比对时同时考虑特征点描述与空间几何关系的相似性,该方法在电路板残片图像自动识别中TOP1准确率高于99%。

    一种多模态行人再辨识技术

    公开(公告)号:CN103942563A

    公开(公告)日:2014-07-23

    申请号:CN201410125981.2

    申请日:2014-03-31

    Abstract: 本申请公开了一种多模态行人再辨识技术,包括以下步骤:步骤1、从第一摄像机和第二摄像机各自拍摄的第一图像和第二图像中分别截取包含目标的前景图像,其中,第二图像对应于已知目标;步骤2、从所截取的前景图像中分别提取颜色特征和纹理特征,并将颜色特征和纹理特征级联,形成图像特征;步骤3、将所述图像特征输入到Hash投影模型,计算第一图像和第二图像中的目标的相似度;步骤4、如果所计算的相似度大于预定阈值,则将第一图像的目标判定为第二图像所对应的已知目标。

    超大型指纹库的索引结构和检索方法

    公开(公告)号:CN101477523B

    公开(公告)日:2011-07-20

    申请号:CN200810180094.X

    申请日:2008-11-24

    Abstract: 本发明用于超大型指纹数据库的指纹检索,提出了超大型指纹库的索引结构和检索方法。本发明属于计算机识别领域,具体涉及到指纹识别、数据库、数据检索和图像处理等领域。本发明提出了一种超大型指纹库检索系统结构的构造方法、基于索引匹配错误概率的索引评价方法、基于分层深度索引的指纹检索方法以及基于一边多次匹配结构特征的检索评价方法来加速超大型指纹库的检索,具有实用价值和普遍的适用性。在离线建库阶段依据基于索引匹配错误概率的索引评价方法对库指纹构建哈希索引、分层深度索引、特征值索引三个功能互补的索引器;在在线检索阶段依据基于索引匹配错误概率的索引评价方法和基于一边多次匹配结构特征的检索评价方法构建检索器。

    一种基于虚幻引擎的多层次语义交互式跨模态跟踪方法

    公开(公告)号:CN119941790A

    公开(公告)日:2025-05-06

    申请号:CN202510001144.7

    申请日:2025-01-02

    Abstract: 本发明提供了一种基于虚幻引擎的多层次语义交互式跨模态跟踪方法。所述方法包括:使用虚幻引擎5构建虚拟仿真世界;构建行人和车辆虚拟多目标跟踪数据;构造文本‑轨迹匹配对生成多模态跟踪数据;构建逐层融合多模态语义特征的多目标跟踪模型;利用文本特征增强感知查询特征;将解码感知特征利用线性层映射到语义空间,并与编码的文本特征计算相似度;利用感知查询结果更新目标轨迹信息;本发明不仅解决了轨迹语义数据集缺失的问题,还通过逐层语义交互模块结合CLIP的跨模态对齐能力,显著提高了模型在复杂动态环境中的语义目标跟踪的准确性和召回率。

    一种基于双模态视频EEG数据的驾驶员视觉显著性区域预测方法

    公开(公告)号:CN113435234B

    公开(公告)日:2024-01-23

    申请号:CN202110019216.2

    申请日:2021-03-25

    Inventor: 赵志诚 杜丽 苏菲

    Abstract: 本发明提供了一种基于双模态视频EEG数据的驾驶员视觉显著性区域预测方法,所述方法包括:采集驾驶员在执行驾驶行为时的视觉注意力相关的脑电图(Electroencephalography,EEG)信号;对采集EEG信号进行预处理,搭建EEG注意力特征初始化框架,提取二维EEG注意力特征;提取视频图像中的低层特征;将提取的二维EEG注意力特征和提取的视频图像低层特征融合,得到双模态数据;基于双模态数据进行预测。本发明在不使用光流信息的条件下,仅分析视频图像的空间信息就得到了较好的驾驶员的视觉注意力信息(Focus field of driver's Attention,FoA)预测效果,本发明进一步完成了从EEG信号中有效提取车辆驾驶员的视觉注意力特征,并将其与视频图像特征相结合,共同完成目标任务。

    一种基于迭代学习的马铃薯病害多分类和检测方法

    公开(公告)号:CN116824241A

    公开(公告)日:2023-09-29

    申请号:CN202310734961.4

    申请日:2023-06-20

    Abstract: 本发明提供了一种基于迭代学习的马铃薯病害多分类和检测方法。所述方法包括:对有标注的马铃薯病害数据,如叶片、虫害、茎秆等图片进行统计,均匀抽取各个类别,将抽取后的数据按照一定比例划分为训练集以及验证集;对训练集数据做数据增强,并输入深度学习模型进行训练,在验证集上调整超参数,求出最优的有监督模型权重;对无标注的马铃薯病害数据,使用上述权重进行模型推理,实现预标注;根据检测置信度进行预标注数据的清洗;冻结模型的主干特征网络,仅反向回传模型最后输出层的梯度;将无标注的马铃薯病害数据输入模型,迭代上述训练和预标注过程,直至评估指标达到平衡。

    基于模板特征点及其拓扑结构的多币种面值识别方法

    公开(公告)号:CN104464079A

    公开(公告)日:2015-03-25

    申请号:CN201410837446.X

    申请日:2014-12-29

    Abstract: 本申请公开了基于模板特征点及其拓扑结构的多币种面值识别方法,包括:1、提取待识别纸币图像的特征点,记录特征点的位置及其特征描述;2、将待识别纸币图像的特征点与各个模板的基准点分别进行第一比对匹配,选取与一个或多个模板的基准点之间的匹配结果满足第一匹配条件的特征点,作为待识别纸币图像的基准点;3、以待识别纸币图像的基准点作为基准,生成其它特征点的拓扑结构信息;4、将待识别纸币图像的其它特征点的特征描述及其拓扑结构信息与一个或多个模板的特征点的特征描述及其拓扑结构信息进行第二比对匹配;5、选取与待识别纸币图像的比对匹配结果满足判别条件的模板所代表的币种及面值,作为待识别纸币图像的面值识别结果。

    一种基于监控视频的实时摔倒事件检测方法

    公开(公告)号:CN103955699A

    公开(公告)日:2014-07-30

    申请号:CN201410125985.0

    申请日:2014-03-31

    Abstract: 本申请公开了一种基于监控视频的实时摔倒事件检测方法,在检测场景中安装有朝向同一目标区域、拍摄角度不同的多个摄像机,多个摄像机连续拍摄目标区域,包括以下步骤:多个摄像机同时拍摄目标区域的一段视频;从多个摄像机各自拍摄的同一时段的多个视频中,分别提取出每一帧画面的代表目标的前景图像;提取同一时刻同一目标的前景图像在由多个摄像机拍摄的画面中的各自的形状和位置特征,并使用RVM分类器,确定每一帧画面对应的时刻的目标姿态类别;将所得到的每一帧画面的目标姿态类别作为目标姿态值序列输入到HMM评估器,得到目标姿态类别变化的后验概率,目标姿态类别变化代表目标摔倒事件发生;如果后验概率大于预定阈值,则确定摔倒发生。

Patent Agency Ranking