基于无人机视频的特定目标检测方法

    公开(公告)号:CN105956559B

    公开(公告)日:2019-05-07

    申请号:CN201610294924.6

    申请日:2016-05-05

    Abstract: 本发明提供一种在无人机航拍视频中使用嵌入式设备,在线实时检测特定目标位置的方法。本发明的方法不需要使用传统目标检测方法的滑动窗口法,而是基于如下流程:DSP将摄像头采集到的图像缩放为352*288大小以便于处理,根据像素的RGB值获得该像素的颜色类别、遍历每个像素点寻找与特定目标颜色分布符合的点(待定点)、对待定点进行分析以确定是否是目标上的点,如是,则在图像中在确定目标大小。利用本发明提出的方法,既可加快检测速度,还可以提高检测的准确率。

    基于切道行为检测的车辆驾驶状态评价方法

    公开(公告)号:CN101870293A

    公开(公告)日:2010-10-27

    申请号:CN200910031026.1

    申请日:2009-04-24

    Abstract: 本发明公开了一种基于切道行为检测的车辆驾驶状态评价方法,通过摄像头对前方路况进行视频采集和实时处理,达到对车辆的不断切道、长时间压线行驶等危险驾驶行为的监测,并及时预警,即在车辆内部安装一个面向前方的摄像头来获取前方路况信息;进行车道线的检测与跟踪;判定车辆的当前位置状态,如果车辆进入压线状态,进行状态跟踪以判定车辆是否变道操作;如果是变道操作,根据最近一段时间内的变道次数判断车辆的行为危险度;如果在近段时间内处于压线状态的总时间占到m%,则做出长时间压线行驶的警报。本发明面向车辆主动安全驾驶,采用计算机单目视觉与图像处理技术,具有系统配置简单、价格成本低、实时性好、能应用于白昼黑夜以及多种气候环境的特点。

    一种面向智能驾驶场景的图像文本特征融合域适应目标检测方法

    公开(公告)号:CN119810600A

    公开(公告)日:2025-04-11

    申请号:CN202411674292.7

    申请日:2024-11-21

    Inventor: 李旻先 翁悦诚

    Abstract: 本发明公开了一种面向智能驾驶场景的图像文本特征融合域适应目标检测方法,该方法设计了一种可以学习域无关特征的深度神经网络,其中包含用于使得特征具备域无关性的图像文本特征融合模块和用于将目标域的特征风格转化为源域的特征风格的特征级风格迁移模块;该方法首先预训练模型,设计文本提示短语并提取语义特征,然后利用添加了图像文本特征融合模块的教师模型生成伪标签,再训练额外添加了特征级风格迁移模块的学生模型,最后通过指数移动平均的方法更新教师模型作为最终结果。本发明提出的方法能够有效提升自动驾驶目标检测模型在目标域数据上的适应能力,同时显著降低数据集的标注成本。

    一种基于深度文本-视觉模态对齐与融合的再识别方法

    公开(公告)号:CN119693683A

    公开(公告)日:2025-03-25

    申请号:CN202411677994.0

    申请日:2024-11-22

    Inventor: 李旻先 张琬沁

    Abstract: 本发明公开了一种基于深度文本‑视觉模态对齐与融合的再识别方法,属于计算机视觉和模式识别领域,该方法设计了一种文本‑视觉模态对齐与融合的深度神经网络,包含文本描述生成模块,视觉特征编码模块,文本特征编码模块和文本‑视觉特征融合模块;该方法首先利用视觉问答生成图像对应实例级文本描述,再通过深度耦合的视觉编码器和文本编码器两个特征提取分支分别生成强对齐的视觉特征和文本特征,最后采用文本‑视觉模态对齐融合技术,联合域无关归一化,增强图像目标前景特征表示,再联合实例归一化提取最终特征,然后利用损失函数模型训练,实现再识别任务。本发明提出的方法能够有效增强目标再识别模型的跨域泛化性能。

    一种基于任务相关性的行人再识别持续学习方法

    公开(公告)号:CN117496444A

    公开(公告)日:2024-02-02

    申请号:CN202311627283.8

    申请日:2023-11-29

    Abstract: 本发明公开了一种基于任务相关性的行人再识别持续学习方法,该方法采用多任务多网络策略,在不依赖数据的情况下实现知识前向迁移,联合使用结构化剪枝、梯度投影和知识蒸馏等技术手段,实现对行人再识别任务的增量学习;该方法首先训练一个深度神经网络模型并其进行结构化剪枝得到压缩网络,然后计算当前任务与历史任务的相关性,以相关参数混合实现知识的前向迁移,以知识蒸馏损失和三元损失重训练压缩模型并得到专家模型。本发明提出的方法可以适用于复杂多变的实际应用场景,同时降低了存储开销并提高了推理效率。

    一种基于移动终端的服饰搜索方法

    公开(公告)号:CN106557489B

    公开(公告)日:2020-11-06

    申请号:CN201510624226.3

    申请日:2015-09-25

    Abstract: 本发明提供一种基于移动终端的服饰搜索方法,用户通过移动终端拍照或者从移动终端的图库中选取一张服饰图片,上传至服务器端进行服饰搜索,具体包括:通过网络爬虫从电商网站上获得服饰商品图片和商品信息,存入服饰数据库,进行图像特征提取形成图像特征池;响应于用户通过移动终端拍摄或者选择的服饰图片,对服饰图片进行裁剪后,在服务器上进行匹配查询;根据查询到的服饰结果,将查询到的相似的服饰图片及相应的服饰信息通过移动终端展示给用户,所述服饰信息包括服饰的品牌、价格和材质。本发明的方法结合服饰商品可视化的特点,为用户提供“以图搜图”的方式进行服饰商品搜索方案,提升用户搜索服饰商品的体验。

    一种基于遗漏负样本挖掘的行人检测方法

    公开(公告)号:CN108416287A

    公开(公告)日:2018-08-17

    申请号:CN201810176956.5

    申请日:2018-03-04

    Abstract: 本发明公开了一种基于遗漏负样本挖掘的行人检测方法。方法为:首先将训练样本输入到基础网络,生成用于RPN网络训练的前景样本和背景样本;然后单独训练RPN网络,使用RPN网络提取训练集上的候选区域作为Fast R-CNN的训练样本;使用阈值T进行遗漏负样本挖掘,将得到的负样本与训练样本合并,训练Fast R-CNN网络;采用交替训练的方式训练RPN网络和Fast R-CNN网络,共享卷积层特征,得到Faster R-CNN目标检测器;最后将待检测图片输入到Faster R-CNN目标检测器,得到行人检测结果。本发明方法计算量小、易于实现,并且提高了行人检测的召回率、精度率和F1测度三个联合测量指标。

    一种基于机器学习的试卷答题卡自动处理方法

    公开(公告)号:CN108388895A

    公开(公告)日:2018-08-10

    申请号:CN201810176948.0

    申请日:2018-03-04

    Inventor: 李旻先 张超

    Abstract: 本发明公开了一种基于机器学习的试卷答题卡自动处理方法。方法为:首先训练涂写目标检测器;然后确定试卷版式,生成试卷并打印;考试者和评阅者填写对应区域,考试者涂写客观题答题区域和主观题答题区域,评阅者评阅主观题并涂写对应的打分区域;接着将完成的试卷扫描为图像,进行图像处理和分区域切割;使用训练好的涂写目标检测器进行目标判定,然后结合正确答案进行分数计算;最后对试卷进行统计和分析:包括对整批试卷的平均分、各个题目的平均分进行计算;对整批试卷和各个题目的分布情况进行计算;进行趋势分析,并从数据库中调取答题部分提供给教师或个体本人查阅。本发明成本低、精度高、灵活性好,并可对试卷作答情况进行高效的统计和分析。

    一种基于超图的图像混合摘要生成方法

    公开(公告)号:CN103020120B

    公开(公告)日:2016-07-06

    申请号:CN201210464502.0

    申请日:2012-11-16

    Inventor: 唐金辉 李旻先

    Abstract: 本发明提供了一种基于超图的图像混合摘要生成方法,具体包括:步骤1:输入原始图像;步骤2:输入标签列表;步骤3:抽取视觉特征;步骤4:建立超图;步骤5:超图分割;步骤6:选取混合摘要。本发明使用的超图模型,不仅可以利用图像与图像、标签与标签之间的同质关系,同时还可以利用图像与标签之间的异质关系;本发明提出的选取图像摘要和标签摘要的方法,同时考虑了语义和视觉的代表性,选取的图像摘要和标签摘要能够较好地代表所属分组。

    基于似物性估计的快速行人检测方法

    公开(公告)号:CN105354549A

    公开(公告)日:2016-02-24

    申请号:CN201510730785.2

    申请日:2015-11-02

    Abstract: 本发明提供一种基于似物性估计的快速行人检测方法。针对传统基于滑动窗口的行人检测方法中因搜索范围过大而导致的检测速度不够高的问题,本发明引入了似物性估计(Objectness Estimation),利用梯度幅值特征来描述检测窗口的似物性,对滑动窗口产生的候选目标窗口做了一个初筛选,并进一步预测得到候选目标区域,从而将待测图片的搜索范围缩小在几个目标区域内,最终以实现加速的目的。具体包括:基于梯度幅值特征的似物性估计模型的建立、根据似物性估计的结果预测得到候选目标区域、在候选目标区域内使用行人HOG特征和SVM分类器完成行人检测。利用本发明提出的方法,可以在很大程度上加快行人检测的速度。

Patent Agency Ranking