文本行中的空格识别方法、装置、电子设备及存储介质

    公开(公告)号:CN111461126A

    公开(公告)日:2020-07-28

    申请号:CN202010231850.8

    申请日:2020-03-23

    发明人: 尚太章

    IPC分类号: G06K9/34

    摘要: 本申请公开了一种文本行中的空格识别方法、装置、电子设备及存储介质,涉及图像处理技术领域。其中,该方法包括:获取文本灰度图,所述文本灰度图中仅包括单行文本;计算所述文本灰度图中预设方向上的每一排像素点的像素值之和,所述预设方向为与所述单行文本中的文字排列方向垂直的方向;将在第一像素值区间内的像素值之和对应的像素点形成的连通域,作为所述单行文本中的空格,所述第一像素值区间为文本灰度图中空格对应的像素值之和所在的区间。该技术方案可以从而确定出单行文本中的空格。

    图像处理方法、装置、电子设备及存储介质

    公开(公告)号:CN111583100A

    公开(公告)日:2020-08-25

    申请号:CN202010398383.8

    申请日:2020-05-12

    发明人: 尚太章

    IPC分类号: G06T3/00 G06K9/62 G06K9/46

    摘要: 本申请公开了一种图像处理方法、装置、电子设备及存储介质,该图像处理方法包括:获取第一图像、第二图像以及初始图像;利用预先训练的至少一个特征提取模型,提取第一图像的内容特征、第二图像的风格特征、初始图像的内容特征以及初始图像的风格特征;根据初始图像的内容特征与第一图像的内容特征的差异,确定内容损失函数的值,以及根据初始图像的风格特征中不同特征之间的相似度,与第二图像的风格特征中对应的不同特征之间的相似度的差异,确定风格损失函数的值;根据内容损失函数的值和风格损失函数的值确定总损失函数的值;根据总损失函数的值调整初始图像,直至得到目标图像。本方法可以较好地实现图像风格的迁移。

    内容识别方法、装置以及电子设备

    公开(公告)号:CN111444904A

    公开(公告)日:2020-07-24

    申请号:CN202010209703.0

    申请日:2020-03-23

    发明人: 尚太章

    IPC分类号: G06K9/20 G06K9/34 G06K9/38

    摘要: 本申请实施例公开了一种内容识别方法、装置以及电子设备。方法包括:对待识别图片进行灰度化处理,得到第一灰度图片;对第一灰度图片所包括的像素点的像素值进行统计,并从统计得到的像素值中确定分割像素值;将第一灰度图片中的目标像素点的像素值调整为目标像素值,以得到第二灰度图片,目标像素点为对应的像素值大于分割像素值的像素点;基于第二灰度图片进行内容识别。本方法实现了对待识别图片进行灰度化得到第一灰度图片后,通过确定分割像素值的方式对该第一灰度图片中再进行一次灰度化操作,得到第二灰度图片,进而使得相比最初的待识别图片,所得到的第二灰度图片中的背景冗余信息能够被有效的降低,有利于提升内容识别的准确性。

    图像识别方法、装置、设备及存储介质

    公开(公告)号:CN111126254A

    公开(公告)日:2020-05-08

    申请号:CN201911334327.1

    申请日:2019-12-23

    发明人: 尚太章

    摘要: 本申请实施例提供了一种图像识别方法、装置、设备及存储介质,涉及计算机视觉技术领域。所述方法包括:获取图像;对图像进行边缘提取,得到图像的边缘图像;根据边缘图像对图像进行边缘信息增强处理,得到边缘信息增强后的图像;通过图像识别模型对边缘信息增强后的图像进行处理,得到图像的识别结果。本申请实施例通过对图像进行边缘提取,得到该图像的边缘图像;根据边缘图像对该图像进行边缘信息增强处理,得到边缘信息增强后的图像,通过图像识别模型对上述边缘信息增强后的图像进行处理,得到图像的识别结果,提高了图像中边缘像素对图像识别的贡献比重,从而提高了图像识别的准确性。

    文本识别方法、装置、电子设备及存储介质

    公开(公告)号:CN111461070B

    公开(公告)日:2023-12-08

    申请号:CN202010356790.2

    申请日:2020-04-29

    发明人: 尚太章

    摘要: 本申请公开了一种文本识别方法、装置、电子设备及存储介质,涉及图像处理技术领域。其中,该方法包括:获取一待识别图片中各个文本图像的清晰度,其中,不同文本图像为所述待识别图片中不同文本分别对应的图像;对清晰度低于预设清晰度的文本图像进行超分辨率处理,提高所述清晰度低于预设清晰度的文本图像的清晰度;对超分辨率处理后的文本图像以及清晰度不低于预设清晰度的文本图像进行文本识别。该方案提高了文本识别成功的概率。

    图像分类方法、装置、移动终端及存储介质

    公开(公告)号:CN110674873B

    公开(公告)日:2022-05-27

    申请号:CN201910906770.5

    申请日:2019-09-24

    发明人: 尚太章

    IPC分类号: G06V10/764

    摘要: 本申请实施例提供一种图像分类方法、装置、移动终端及存储介质,该方法应用于移动终端,该方法包括:获取待分类图像中包含的第一目标检测框,计算第一目标检测框的第一长宽比;确定第一长宽比落入的目标长宽比区间,根据长宽比区间与分类检测模型的对应关系确定与目标长宽比区间对应的目标分类检测模型;将第一目标检测框输入目标分类检测模型进行分类,得到第一目标检测框的分类结果。本申请实施例可以提高图像分类识别的准确率。

    语音播报方法、装置、电子设备及存储介质

    公开(公告)号:CN110503991B

    公开(公告)日:2022-03-18

    申请号:CN201910726890.7

    申请日:2019-08-07

    发明人: 尚太章

    IPC分类号: G11C7/16 G06F16/63

    摘要: 本申请实施例公开了一种语音播报方法、装置、电子设备及存储介质,涉及语音处理技术领域。所述方法应用于服务器,所述方法包括:接收音频播放请求信息,所述音频播放请求信息包括待播放的音频文件的摘要信息,其中,所述摘要信息至少包括作者信息和音频名称;根据所述摘要信息,生成播报语音,所述播报语音包括使用以所述作者信息对应的声音播报的所述摘要信息;将所述播报语音发送至音频播放终端的音频应用的应用接口,所述播报语音用于指示所述音频应用在播放所述音频文件之前,播放所述播报语音。让用户能够在每个音频文件播放前获知该音频文件的相关介绍,避免了用户在听音频文件时的盲目性,也便于用户后续对该音频文件的查找。

    目标检测模型、应用方法及相关装置

    公开(公告)号:CN111767947B

    公开(公告)日:2024-08-13

    申请号:CN202010571484.0

    申请日:2020-06-19

    发明人: 尚太章

    摘要: 本申请实施例公开了一种目标检测模型、应用方法及相关装置,包括:包括特征提取模块、特征融合模块和目标检测模块,特征提取模块连接特征融合模块和目标检测模块,特征融合模块连接目标检测模块;特征提取模块,用于提取原始图像的多种尺度的特征图;特征融合模块,用于对多种尺度的特征图中至少三个特征图进行特征融合,至少三个特征图包括尺度相同和不同的特征图;目标检测模块,用于根据多个特征图中未进行特征融合的特征图和特征融合后的特征图,得到原始图像中待检测目标的目标类别和目标位置。本申请实施例在不过度增加模型复杂度的基础上提高目标检测准确度,针对轻量化的目标检测模型的小目标检测尤其适用。

    地图构建方法及装置、定位方法及装置

    公开(公告)号:CN110866953B

    公开(公告)日:2023-12-29

    申请号:CN201911056898.3

    申请日:2019-10-31

    摘要: 本公开涉及地图构建及定位技术领域,具体涉及一种地图构建方法、一种地图构建装置、一种定位方法、一种定位装置、一种计算机可读介质以及一种无线通信终端。地图构建方法包括:采集当前环境的环境图像;获取所述环境图像的图像特征信息,根据图像特征信息对连续的所述环境图像进行特征点匹配以筛选关键帧图像;其中,图像特征信息包括特征点信息和对应的描述子信息;获取所述关键帧图像中匹配的特征点对应的深度信息,以构建所述关键帧图像的三维特征信息;基于所述关键帧图像构建所述当前环境的地图数据;其中,地图数据包括所述关键帧图像对应的图像特征信息和三维特征信息。本公开提供的方法定位高精度、鲁棒性强,适用于多种复杂场景。

    字体识别方法及装置、电子设备、存储介质

    公开(公告)号:CN111626383B

    公开(公告)日:2023-11-07

    申请号:CN202010478196.0

    申请日:2020-05-29

    发明人: 尚太章

    IPC分类号: G06V30/244 G06V30/19

    摘要: 本申请实施例公开了一种字体识别方法,所述方法包括:获取待识别图像;利用预训练识别模型,对所述待识别图像进行文本位置识别和字体识别,得到至少一个文本位置处的至少一个文本对应的至少一个字体类型;其中,所述预训练识别模型用于确定图像中文本位置,以及所述文本位置处文本的字体类型;对所述至少一个文本进行内容识别,得到至少一个内容信息;基于所述至少一个字体类型和所述至少一个文本位置,在电子设备的显示界面显示所述至少一个内容信息。本申请实施例同时公开了一种字体识别装置、电子设备、存储介质。