-
公开(公告)号:CN106156777B
公开(公告)日:2020-06-02
申请号:CN201510197323.9
申请日:2015-04-23
申请人: 华中科技大学 , 腾讯科技(深圳)有限公司
IPC分类号: G06K9/46
摘要: 本发明公开了一种文本图片检测方法及装置,属于多媒体技术领域。所述方法包括:对于每一个待检测自然图片,在所述待检测自然图片中提取多个候选区域;计算每一个目标区域的类别响应,所述目标区域通过对所述多个候选区域进行过滤处理得到;根据每一个目标区域的类别响应,计算所述待检测自然图片的特征向量,所述特征向量的维数与所述类别响应的维数相等;当所述特征向量位于预先设置的文本图片归属的特征向量范围内时,确定所述待检测自然图片为文本图片。由于上述文本图片检测方式可对自然图片中的文本图片进行检测,所以该种检测方式的应用范围较为广泛,普适性强。
-
公开(公告)号:CN106599900B
公开(公告)日:2020-04-21
申请号:CN201510682699.9
申请日:2015-10-20
申请人: 华中科技大学 , 腾讯科技(深圳)有限公司
摘要: 本发明公开了一种识别图像中的字符串的方法和装置,属于计算机技术领域。所述方法包括:根据训练样本库中存储的包含有字符串的样本图像块的图像数据,并基于卷积神经网络算法,构建样本图像块的字符串识别结果对应的概率集合的表达式,概率集合的表达式由待定参数构成;基于使根据概率集合确定出的字符串识别结果为预先存储的样本图像块包含的字符串的概率最大的原则,对待定参数进行训练,得到待定参数的训练值;当获取到待识别的目标图像块时,基于卷积神经网络算法和待定参数的训练值,确定目标图像块的字符串识别结果对应的目标概率集合,根据目标概率集合,确定目标图像块的字符串识别结果。采用本发明,可以提高识别的正确率。
-
公开(公告)号:CN110837835A
公开(公告)日:2020-02-25
申请号:CN201911038568.1
申请日:2019-10-29
申请人: 华中科技大学
摘要: 本发明公开了一种基于边界点检测的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过多方向矩形检测网络检测文本实例的更为精准的多方向包围盒;其次在多方向包围盒内检测文本的上下两条边界点序列;最后利用检测到的边界点序列将任意形状的文本转化为水平文本供后续的基于注意力机制的序列识别网络进行识别,最后利用集束搜索算法找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以在不需要字符级别的标注情况下同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。
-
公开(公告)号:CN110717427A
公开(公告)日:2020-01-21
申请号:CN201910921351.9
申请日:2019-09-27
申请人: 华中科技大学
摘要: 本发明公开了一种基于顶点滑动的多方向物体检测算法。与传统的回归角度或者回归四个顶点的方法不同,该方法不存在回归角度所带来的不稳定问题,也不存在回归四个顶点所带来的歧义。首先,通过卷积网络所获取到的特征同时预测物体的水平包围盒、滑动顶点、及其倾斜包围盒相对于水平包围盒的面积比例,从而得到物体的水平包围盒、倾斜包围盒及倾斜程度,通过倾斜程度确定究竟是选择倾斜或是水平包围盒。对于倾斜程度较大的物体,选择倾斜包围盒;对于几近水平的物体,直接选择该物体水平包围盒。该方法是针对在多方向物体领域常用的两种表示方法所提出的第三种方法,实现简单,几乎不增加额外时间,能显著提升检测性能,具有很强的实际应用价值。
-
公开(公告)号:CN108564119A
公开(公告)日:2018-09-21
申请号:CN201810295994.2
申请日:2018-04-04
申请人: 华中科技大学
摘要: 本发明公开了一种基于生成对抗网络的任意姿态行人图片生成方法,仅通过将人物图片、图中行人的姿态以及目标迁移姿态的热力图输入生成器网络,即可得到前一位目标姿态的相同人物的图片。由于该方法的生成器中引入了姿态注意力机制,且采用了两个不同的判别器分别进行外貌一致性和姿态一致性的判别,使其能够应对图像变形、几何变换、视角转移等多种复杂情况。并且可以端到端训练。本发明提出的任意姿态的人物图片生成方法在现有技术思路的基础上进行了创新,采用新颖的结构进行网络模型搭建,相较于之前的方法,所合成的图片更加真实、自然,有很强的实际应用价值。
-
公开(公告)号:CN105740909A
公开(公告)日:2016-07-06
申请号:CN201610072466.1
申请日:2016-02-02
申请人: 华中科技大学
IPC分类号: G06K9/62
CPC分类号: G06K9/6256 , G06K9/6267
摘要: 本发明公开了一种基于空间变换的自然场景下文本识别方法,首先对训练图像集中的文本图像,获取图像的文本内容,并训练基准点定位网络、图像预处理网络、图像编码器网络以及特征解码器网络等网络模型;然后利用训练得到的网络模型对待识别图像集中图像进行空间变换,得到变换后的待识别图像;然后计算变换后的待识别图像的特征向量以及预测概率序列,最终获取图像识别的结果。本发明方法文本识别准确率高,且能够克服文本排列不规则等不利因素的影响。
-
公开(公告)号:CN105608456A
公开(公告)日:2016-05-25
申请号:CN201510989079.X
申请日:2015-12-22
申请人: 华中科技大学
IPC分类号: G06K9/32
CPC分类号: G06K9/3258 , G06K2209/01
摘要: 本发明公开了一种基于全卷积网络的多方向文本检测方法,首先获取训练数据集中的文本块,并训练全卷积网络模型;然后利用训练好的全卷积网络模型对测试数据集中的图片进行检测,获取文本块;然后提取文本块的字符成分,并根据字符成分的位置信息估算图像中的候选文本条位置;最后训练针对文本条中字符成分的全卷积网络模型,利用训练好的模型对候选文本条进行检测,获取其中的字符成分,根据字符成分过滤掉不需要的文本条,得到图像中文本条的位置。本发明方法文本检测方法检测率高,且能够克服光照、遮挡、模糊等不利因素的影响。
-
公开(公告)号:CN101140660B
公开(公告)日:2010-05-19
申请号:CN200710053534.0
申请日:2007-10-11
申请人: 华中科技大学
IPC分类号: G06T5/00
摘要: 本发明公开了一种基于离散曲线演化的骨架剪枝方法,属于图像处理技术领域。二值图像骨架化方法得到的骨架都受制于对边界噪声的敏感性,限制了骨架在图像处理领域中的应用。本发明利用离散曲线演化求出图像的轮廓分割,删除生成点在同一轮廓分割上的骨架点,达到删除由边缘噪声引起的冗余骨架分支而保持视觉上重要骨架分枝的目的。本发明综合考虑了物体的全局信息,剪枝后的骨架非常稳定;能保持骨架的拓扑不变性;可以彻底删除不必要的骨架分枝,而避免重要的骨架分枝被缩短;本发明时间复杂度低,且可实现对骨架的多尺度剪枝。本发明在医学图像分析、物体识别、零件检测、三维建模、计算机辅助设计等方向有着潜在的应用。
-
公开(公告)号:CN101505487A
公开(公告)日:2009-08-12
申请号:CN200910060883.4
申请日:2009-02-27
申请人: 华中科技大学
摘要: 本发明公布了一种传感器网络骨架提取方法,包括以下步骤:1.找出边界上的角点,将边界被划分为有限个边界分支;2.识别出相互连通的骨架节点;3.在连通的骨架节点中搜索最远距离的两骨架节点,连接这两个骨架节点生成骨架弦;4.连接相邻骨架弦,再将角点与最近骨架弦相连,生成粗糙骨架图;5.采用剪枝方法优化粗糙骨架图,得到最终骨架。本发明利用不同边界分支确定骨架节点,与传统的算法相比,不会受到边界扰动影响,因而能得到更加近似的网络拓扑结构,从而更好的重构网络。
-
公开(公告)号:CN101140660A
公开(公告)日:2008-03-12
申请号:CN200710053534.0
申请日:2007-10-11
申请人: 华中科技大学
IPC分类号: G06T5/00
摘要: 本发明公开了一种基于离散曲线演化的骨架剪枝方法,属于图像处理技术领域。二值图像骨架化方法得到的骨架都受制于对边界噪声的敏感性,限制了骨架在图像处理领域中的应用。本发明利用离散曲线演化求出图像的轮廓分割,删除生成点在同一轮廓分割上的骨架点,达到删除由边缘噪声引起的冗余骨架分支而保持视觉上重要骨架分枝的目的。本发明综合考虑了物体的全局信息,剪枝后的骨架非常稳定;能保持骨架的拓扑不变性;可以彻底删除不必要的骨架分枝,而避免重要的骨架分枝被缩短;本发明时间复杂度低,且可实现对骨架的多尺度剪枝。本发明在医学图像分析、物体识别、零件检测、三维建模、计算机辅助设计等方向有着潜在的应用。
-
-
-
-
-
-
-
-
-