图像的处理方法、装置、电子设备和存储介质

    公开(公告)号:CN114494290A

    公开(公告)日:2022-05-13

    申请号:CN202210037411.2

    申请日:2022-01-13

    发明人: 李楠 宋祺 张睿

    摘要: 本发明实施例提供了一种图像的处理方法和装置,其中,所述方法包括:按照切块规则和图像块尺寸将原始图像切割为一组包含多个图像块的图像块序列;将图像块序列输入至神经网络提取出各图像块的图像特征;基于注意力机制对各图像块的图像特征进行池化处理得到图像块序列的融合图像特征;将融合图像特征输入至全卷积网络输出图像块序列的分类结果,将图像块序列的分类结果作为原始图像的分类结果。本发明实施例采用全卷积网络输出原始图像的分类结果,网络结构较为简单,与分割方式相比,计算复杂度低。本发明实施例避免将原始图像resize到统一尺寸,维持原始图像的质量,与卷积分类网络相比,输出比较准确的分类结果,通用性高。

    文字识别方法、装置、存储介质及电子设备

    公开(公告)号:CN112183250A

    公开(公告)日:2021-01-05

    申请号:CN202010963512.3

    申请日:2020-09-14

    摘要: 本公开涉及一种文字识别方法、装置、存储介质及电子设备,该方法包括:通过对待识别图像中的文字进行定位检测,得到所述待识别图像中的文字框,其中,每一所述文字框中的文字具有同一行文方向;针对每一所述文字框,确定该文字框中文字的所述行文方向;并根据该文字框的所述行文方向,得到该文字框的文字识别结果。采用这种方法,不管待识别图像中的文字是何种字体类型、字号大小,也不管该待识别图像中的文字是何种行文方向以及采用了何种排版方式,都能检测得到该待识别图像中的文字框,并可以根据检测到的每一文字框的行文方向,得到对应行文方向的文字识别结果。因此这种方法可以针对任意版式的图像进行文字识别。

    一种图像模糊检测方法及装置

    公开(公告)号:CN110288560A

    公开(公告)日:2019-09-27

    申请号:CN201810218556.6

    申请日:2018-03-16

    发明人: 李楠 张睿 宋祺

    IPC分类号: G06T7/00

    摘要: 本申请提供一种图像模糊检测方法、装置及计算机可读存储介质和电子设备。其中,所述方法包括:获取待检测图像的灰度图像;计算所述灰度图像对应的图像梯度;基于积分图算法,计算出所述图像梯度的峰度值;根据所述峰度值确定所述待检测图像的模糊度。应用本申请,可以提升图像模糊检测的效率。

    文字识别方法、装置、电子设备及存储介质

    公开(公告)号:CN112329766A

    公开(公告)日:2021-02-05

    申请号:CN202011098938.3

    申请日:2020-10-14

    摘要: 本申请实施例公开了一种文字识别方法、装置、电子设备及存储介质,该方法包括:通过标准卷积提取待识别图像的图像特征并扩展通道数,生成第一特征图;通过包括逐点组卷积和深度卷积的模块化结构对所述第一特征图进行特征提取处理,得到处理后特征图;对所述处理后特征图进行池化处理,得到池化特征图;将所述池化特征图作为所述模块化结构的输入,循环执行上述的模块化结构处理和池化处理,直至得到的池化特征图满足预设条件;对所述池化特征图进行标准卷积处理,得到编码结果;对所述编码结果进行解码,得到识别结果。本申请实施例在保证识别精度的前提下,降低了计算复杂度,提高了识别速度,而且降低了计算资源的消耗。

    图片分类方法、装置、电子设备
    5.
    发明公开

    公开(公告)号:CN112184284A

    公开(公告)日:2021-01-05

    申请号:CN202010917573.6

    申请日:2020-09-03

    发明人: 李楠 宋祺 张睿

    摘要: 本申请公开了一种图片分类方法,属于计算机技术领域,有助于对上传至网络平台的图片进行准确分类。本申请实施例公开的图片分类方法包括:获取目标图片,以及所述目标图片的标签文本和描述文本;基于空间注意力机制确定所述目标图片的图片内容的向量表示,以及,分别确定所述标签文本和所述描述文本的向量表示;基于所述图片内容的向量表示、所述标签文本和所述描述文本的所述向量表示,对所述目标图片进行分类处理。本方法通过结合图片内容和标签文本、描述文本对图片进行自动分类,可以提升图片分类的速度和准确度;通过基于空间注意力机制学习图像中重要的区域,对输入的图片数据进行增强处理,然后用于图片分类,进一步提升了图片分类准确率。

    图像处理方法、装置、电子设备及可读存储介质

    公开(公告)号:CN110738602B

    公开(公告)日:2021-01-01

    申请号:CN201910866716.2

    申请日:2019-09-12

    发明人: 李楠 张睿

    IPC分类号: G06T3/60 G06K9/32 G06K9/36

    摘要: 本申请实施例提供了一种图像处理方法、装置、电子设备及可读存储介质,旨在降低文字识别结果的错误率。所述方法包括:对待处理图像进行目标区域检测,得到所述待处理图像上包含文本图像的目标区域;根据所述包含文本图像的目标区域,对所述待处理图像进行剪裁,得到包含所述文本图像的子图像;对所述子图像中的所述文本图像进行角点预测,得到所述文本图像的角点位置信息;根据所述文本图像的角点位置信息,确定针对所述文本图像的矫正参数,并根据所述矫正参数对所述文本图像进行投影矫正,获得投影矫正后的目标文本图像;对所述目标文本图像进行文字识别,获得该本文图像中的文字信息。

    文字识别方法、装置、电子设备及存储介质

    公开(公告)号:CN112329766B

    公开(公告)日:2024-10-15

    申请号:CN202011098938.3

    申请日:2020-10-14

    摘要: 本申请实施例公开了一种文字识别方法、装置、电子设备及存储介质,该方法包括:通过标准卷积提取待识别图像的图像特征并扩展通道数,生成第一特征图;通过包括逐点组卷积和深度卷积的模块化结构对所述第一特征图进行特征提取处理,得到处理后特征图;对所述处理后特征图进行池化处理,得到池化特征图;将所述池化特征图作为所述模块化结构的输入,循环执行上述的模块化结构处理和池化处理,直至得到的池化特征图满足预设条件;对所述池化特征图进行标准卷积处理,得到编码结果;对所述编码结果进行解码,得到识别结果。本申请实施例在保证识别精度的前提下,降低了计算复杂度,提高了识别速度,而且降低了计算资源的消耗。

    识别证照图像完整性的方法、装置、设备及存储介质

    公开(公告)号:CN113947775A

    公开(公告)日:2022-01-18

    申请号:CN202111165131.1

    申请日:2021-09-30

    IPC分类号: G06V30/40 G06V10/40 G06K9/62

    摘要: 本申请公开了识别证照图像完整性的方法、装置、设备及存储介质,属于图像处理技术领域。所述方法包括:获取图像识别模型及待识别的证照图像,图像识别模型包括目标分类器网络子模型与目标主干网络子模型,目标分类器网络子模型与目标主干网络子模型基于样本图像训练得到;将证照图像输入至目标主干网络子模型,通过目标主干网络子模型输出证照图像的图像特征;将图像特征输入至目标分类器网络子模型,通过目标分类器网络子模型输出证照图像的分类结果;基于证照图像的分类结果得到证照图像的完整性识别结果。本申请使用子模型的完成的任务要求低,易于实现,降低成本,可以直接根据证照图像的分类结果得到完整性识别结果,准确率与通用性较高。

    一种图像模糊检测方法及装置

    公开(公告)号:CN110288560B

    公开(公告)日:2021-03-02

    申请号:CN201810218556.6

    申请日:2018-03-16

    发明人: 李楠 张睿 宋祺

    IPC分类号: G06T7/00

    摘要: 本申请提供一种图像模糊检测方法、装置及计算机可读存储介质和电子设备。其中,所述方法包括:获取待检测图像的灰度图像;计算所述灰度图像对应的图像梯度;基于积分图算法,计算出所述图像梯度的峰度值;根据所述峰度值确定所述待检测图像的模糊度。应用本申请,可以提升图像模糊检测的效率。