-
公开(公告)号:CN117333883A
公开(公告)日:2024-01-02
申请号:CN202311298972.9
申请日:2023-10-07
申请人: 华中科技大学
摘要: 本发明提出了一种基于深度学习和表意文字描述序列的多种类汉字识别方法,包括以下步骤:首先利用汉字表意文字描述序列,生成已有近九万种汉字以及随机生成不存在的汉字的图像数据,然后将图像数据经过大量数据增强后通过残差网络,并采用改进后的交叉损失函数进行训练,最后对于输入图片进行多种类汉字的识别。本发明通过输入种类繁多的汉字图像以及不断随机生成不存在的新汉字图像,利用深度的残差网络和改进后的交叉熵损失函数进行训练,这样的训练方式不仅增强了对生僻字的识别能力,还实现了对隶定字的有效区分。
-
公开(公告)号:CN116863426A
公开(公告)日:2023-10-10
申请号:CN202310843628.7
申请日:2023-07-10
申请人: 华中科技大学
IPC分类号: G06V20/56 , G06V10/80 , G06V10/52 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084
摘要: 本发明涉及一种基于扩散模型的三维点云目标检测方法:获取点云数据并进行体素化和数据增强;将体素化后的数据送入体素编码器,转换为稠密鸟瞰图视角的二维稠密特征;在鸟瞰图视角下的标注框送入基于扩散模型的候选框生成器中返回产生的噪声框和时间步水平;在二维特征上裁剪对应特征并送入检测解码器进行预测;优化损失函数,进行迭代训练直至模型收敛;利用训练好的模型进行三维目标检测。本发明通过利用扩散模型生成候选框,在推理时能直接使用从高斯分布中采用的随机框作为候选,避免手工经验式设计锚框尺寸,让检测解码器更加鲁棒,能够适应不同噪声水平的输入并得到检测结果。本发明还提供了相应的基于扩散模型的三维点云目标检测装置。
-
公开(公告)号:CN116363595A
公开(公告)日:2023-06-30
申请号:CN202310387316.X
申请日:2023-04-07
申请人: 华中科技大学
IPC分类号: G06V20/52 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/088
摘要: 本发明公开了一种无监督人群计数方法、装置及存储介质,方法包括将第一输入图像裁剪为图像块,并获取图像块的粗粒度文本;将图像块输入第一图像编码器,将粗粒度文本输入第一文本编码器,生成第一相似度矩阵,根据第一相似度矩阵和第一区分度类别相似度,筛选出第一目标类别的图像块;获取第二目标类别的图像块的细粒度文本,并输入第二文本编码器,生成第二相似度矩阵,并根据第二相似度矩阵和第二区分度类别相似度,筛选出第二目标类别的图像块,并输入第二图像编码器,将计数文本输入第三文本编码器,生成目标相似矩阵,根据目标相似矩阵和计数文本的相似度,获取图像的人群数量。本发明不需要任何人工标签,极大减少了标注成本。
-
公开(公告)号:CN115901777A
公开(公告)日:2023-04-04
申请号:CN202211370869.6
申请日:2022-11-03
申请人: 华中科技大学 , 武汉精测电子集团股份有限公司 , 武汉精立电子技术有限公司
IPC分类号: G01N21/88
摘要: 本发明涉及光学检测技术领域,提供了一种透明材质缺陷成像对比度增强的方法与装置。使用竖直条纹结构光激励序列对待检测样本进行一级检测,根据一级检测的结果,确认待检测样本的缺陷类型;根据一级检测确认的待检测样本的缺陷类型,选择与之适配的用于二级检测的结构光激励序列,并完成当前待检测样本的缺陷检测。本发明针对不同类型潜在缺陷,设计不同的结构光激励图案,通过结构光发生装置,显示对应图案形成不同结构光激励条件,再利用工业相机采集缺陷成像,以达到各种类型缺陷成像对比度都可显著提升的目的。
-
公开(公告)号:CN111444769B
公开(公告)日:2022-07-01
申请号:CN202010116963.3
申请日:2020-02-25
申请人: 华中科技大学
IPC分类号: G06V40/10 , G06V10/774 , G06V10/762 , G06V10/764 , G06V10/70 , G06K9/62 , G06N3/00
摘要: 本发明公开了一种基于多尺度自适应随机森林的激光雷达检测人腿方法,用于从2D激光雷达点云中检测出行人腿部。与传统的检测人腿的方法不同,该方法能够鲁棒地处理由于2D激光雷达数据的不稳定导致分类器检测能力下降的问题,同时也能够处理2D激光雷达数据的多尺度特性对检测的影响。首先,通过聚类算法将2D激光雷达点云聚类成多个点簇;其次,从每一个点簇中提取多维特征构成特征向量;进一步,将该特征向量输入分类器,分类器输出该点簇是人腿的置信度。该方法是针对2D激光雷达下进行人腿检测任务所提出的一种新颖的检测方法,其实现简单,易于扩展,具有较高的计算效率和检测准确度,能够部署在低成本机器人上,具有很强的实际应用价值。
-
公开(公告)号:CN111444767B
公开(公告)日:2022-06-21
申请号:CN202010116935.1
申请日:2020-02-25
申请人: 华中科技大学
摘要: 本发明公开了一种基于激光雷达的行人检测和追踪方法,用于从2D激光雷达点云中检测出行人并对其进行连续的追踪。与传统的行人检测和追踪的方法不同,该方法更加鲁棒的处理由于2D激光雷达数据的不稳定性及多尺度特性对检测的影响。首先,本方法利用了一种多尺度自适应随机森林分类器算法将人腿从激光雷达点云中准确且高效的检测出来;其次,该方法引入局部栅格地图来排除静态近似人腿的障碍物对行人检测的影响;进一步,通过Tracking‑by‑Detection策略,从检测的人腿中检测行人,同时建立行人的匀速运动模型;最后,利用卡尔曼滤波器对行人进行追踪,追踪的同时判断行人下一时刻的位置与下一时刻检测的人腿进行数据关联,以对下一时刻的行人进行快速检测与追踪。
-
公开(公告)号:CN111445497A
公开(公告)日:2020-07-24
申请号:CN202010117523.X
申请日:2020-02-25
申请人: 华中科技大学
IPC分类号: G06T7/223
摘要: 本发明公开了一种基于尺度上下文回归的目标追踪与跟随方法,包括:通过单目摄像机采集图片,用户通过在待跟随目标上设置一个标识物体所在图像区域的矩形包围盒来初始化追踪过程;使用尺度上下文回归模型进行目标追踪,获取目标位置和尺度;使用基于局部块的追踪目标质量评估方法,判断是否发生目标丢失并及时的进行重检测;建立跟随者自身与待跟随目标的相对位置关系,同时基于此相对位置关系调整跟随者自身位姿。本发明在目标跟随过程中,增强系统判别与待跟随目标具有相似语义干扰物的能力,通过后处理使系统能够判断目标是否丢失并及时进行重检测,建立自身与目标的相对位置关系,最后调整自身位姿进行跟随。
-
公开(公告)号:CN111444768A
公开(公告)日:2020-07-24
申请号:CN202010116956.3
申请日:2020-02-25
申请人: 华中科技大学
摘要: 本发明公开了一种用于反光地面场景的微小障碍物发现方法,包括:对反光地面场景的小障碍物数据集进行障碍物及地面的实例级标注,得到带标注的标准训练数据集;训练基于几何线索和表观线索融合的障碍物发现模型,从图像中提取区域级的几何特征及区域级的表观特征,并根据带标注的标准训练数据集,采用随机森林作为学习器,学习到每一个图像区域存在障碍物的概率,得到基于几何线索和表观线索融合的障碍物发现模型;利用上述训练好的模型对机器人视角的场景图片进行障碍物发现。本发明利用机器人的位姿信息,并构建了区域级的几何特征,可以表达单张图片中无法体现出的空间几何特征。相比于现有技术可以极大减小地面上的障碍物误检测。
-
公开(公告)号:CN111444767A
公开(公告)日:2020-07-24
申请号:CN202010116935.1
申请日:2020-02-25
申请人: 华中科技大学
摘要: 本发明公开了一种基于激光雷达的行人检测和追踪方法,用于从2D激光雷达点云中检测出行人并对其进行连续的追踪。与传统的行人检测和追踪的方法不同,该方法更加鲁棒的处理由于2D激光雷达数据的不稳定性及多尺度特性对检测的影响。首先,本方法利用了一种多尺度自适应随机森林分类器算法将人腿从激光雷达点云中准确且高效的检测出来;其次,该方法引入局部栅格地图来排除静态近似人腿的障碍物对行人检测的影响;进一步,通过Tracking-by-Detection策略,从检测的人腿中检测行人,同时建立行人的匀速运动模型;最后,利用卡尔曼滤波器对行人进行追踪,追踪的同时判断行人下一时刻的位置与下一时刻检测的人腿进行数据关联,以对下一时刻的行人进行快速检测与追踪。
-
公开(公告)号:CN106156711B
公开(公告)日:2020-06-30
申请号:CN201510190211.0
申请日:2015-04-21
申请人: 华中科技大学 , 腾讯科技(深圳)有限公司
摘要: 本发明公开一种文本行的定位方法及装置,属于计算机视觉技术领域。该方法包括:提取待检测图像中各个像素的至少包括对称性特征向量的特征向量;根据每个像素的特征向量,确定多个潜在位于文本行对称轴上的目标像素,位于文本行对称轴上的像素具有对称性;对各个目标像素进行聚合,得到多个候选文本行区域;滤除非文本行区域得到文本行区域。由于待检测图像中的文本行区域通常具有对称性,因此,基于提取待检测图像中每个像素的对称性特征向量,能够从自然图像中直接定位到待检测图像中的文本行区域,而无需对各个候选字符区域进行组合以得到文本行区域,不仅方式简单,而且不依赖于自然图像中的连通区域,扩大了文本行定位方式的适用范围。
-
-
-
-
-
-
-
-
-