一种训练文本分类模型的方法、装置、设备及存储介质

    公开(公告)号:CN115393872A

    公开(公告)日:2022-11-25

    申请号:CN202211322295.5

    申请日:2022-10-27

    IPC分类号: G06V30/19

    摘要: 本申请提供一种训练文本分类模型的方法、装置、设备及存储介质,可以应用于人工智能领域或车联网领域等,用于解决训练得到的目标文本分类模型的分类准确性和分类可靠性较低问题。该方法至少包括:分别对所述多个文本行样本图像进行至少一种文本变换,获得相应的构造图像对;采用文本分类模型,分别对获得的各构造图像对进行特征提取,获得相应的图像特征对;基于获得的各图像特征对各自包含的两个图像特征之间的差异,调整所述文本分类模型的模型参数。训练过程中,不需要大量的标注有文本类别的样本图像参与训练,避免样本图像不足而造成训练出的目标本文分类模型的分类准确性和分类可靠性较低的问题。

    一种曲面图像生成方法、装置、电子设备和存储介质

    公开(公告)号:CN114581508B

    公开(公告)日:2024-10-18

    申请号:CN202210179218.2

    申请日:2022-02-25

    摘要: 本发明实施例公开了一种曲面图像生成方法、装置、电子设备和存储介质;本发明实施例可应用于云技术、人工智能、智慧交通、车联网等场景,可基于曲面映射矩阵对平面图像中各像素点的坐标进行映射,得到各像素点的初始坐标值,从平面图像中确定弯曲定位线,计算各像素点到弯曲定位线的距离,基于图像弯曲类型以及距离计算各像素点对应的坐标权重,根据各像素点的坐标权重和初始坐标值计算各像素点的曲面映射坐标值,计算曲面映射坐标值与初始坐标值间的位置增量,基于位置增量和曲面映射矩阵生成新的曲面映射矩阵,返回执行前述步骤直至达到映射结束条件,基于各像素点的曲面映射坐标值以及像素值生成目标曲面图像;可以提升曲面图像的生成效率。

    文本检测方法、装置、存储介质、电子设备及产品

    公开(公告)号:CN117037175A

    公开(公告)日:2023-11-10

    申请号:CN202211190875.3

    申请日:2022-09-28

    摘要: 本申请公开了一种文本检测方法、装置、存储介质、电子设备及产品,涉及人工智能技术领域,本申请可以应用于区块链、云技术及地图车联网等领域,该方法包括:提取待检测图像对应的特征图,所述待检测图像中包括文本;对所述特征图进行文本检测处理,得到所述文本对应的文本区域;对所述特征图进行阅读方向预测处理,得到所述文本区域中像素对应的字符阅读方向向量;基于所述文本区域中像素对应的字符阅读方向向量进行计算,得到所述文本对应的单字阅读方向向量;根据所述单字阅读方向向量确定所述文本的阅读方向,所述阅读方向用于裁剪所述文本对应的行图像进行文本检测。本申请可以有效提升文本检测准确性。

    文本识别方法、装置、计算机设备和计算机可读存储介质

    公开(公告)号:CN115909336A

    公开(公告)日:2023-04-04

    申请号:CN202110942358.6

    申请日:2021-08-17

    摘要: 本申请实施例公开了一种文本识别方法、装置、计算机设备和计算机可读存储介质,通过获取文本图像样本;根据文本图像样本的图像属性信息进行图像指标计算,基于计算结果确定参考样本指标;通过特征提取模型针对文本图像样本进行图像特征提取处理,得到图像特征信息;通过特征提取模型基于图像特征信息,进行注意力特征提取,得到关注上下文信息的注意力特征信息;基于注意力特征信息,预测预测样本指标;根据预测样本指标和对应的参考样本指标,对特征提取模型进行训练,以通过训练后特征提取模型提取待识别文本图像的注意力特征信息进行图像文本识别。该方案可以利用大量无标注文本图像样本对特征提取模型进行训练,增强特征提取模型的训练效果。

    弯曲文本识别方法、装置、设备和介质

    公开(公告)号:CN116958989A

    公开(公告)日:2023-10-27

    申请号:CN202310670621.X

    申请日:2023-06-07

    摘要: 本申请提供了弯曲文本识别方法、装置、设备和介质,涉及人工智能技术领域,可以应用于云技术、人工智能、智慧交通、辅助驾驶等场景,包括获取包含待识别文本的目标图像;对目标图像进行高层特征提取,得到文本方向特征,文本方向特征包括目标图像对应的多个特征点的特征方向信息,特征方向信息用于指示特征点对应的字符的文字朝向;基于文本方向特征对目标图像进行文本图像特征提取,得到文本特征图,文本方向特征用于确定文本图像特征提取过程中目标图像的空间采样位置;基于文本特征图进行文本识别,得到待识别文本对应的文本识别结果。本申请能够提升空间采样与文字朝向的适配性,实现不同朝向文字的特征提取,显著提升弯曲文本的识别精度。

    一种训练文本分类模型的方法、装置、设备及存储介质

    公开(公告)号:CN115393872B

    公开(公告)日:2023-01-17

    申请号:CN202211322295.5

    申请日:2022-10-27

    IPC分类号: G06V30/19

    摘要: 本申请提供一种训练文本分类模型的方法、装置、设备及存储介质,可以应用于人工智能领域或车联网领域等,用于解决训练得到的目标文本分类模型的分类准确性和分类可靠性较低问题。该方法至少包括:分别对所述多个文本行样本图像进行至少一种文本变换,获得相应的构造图像对;采用文本分类模型,分别对获得的各构造图像对进行特征提取,获得相应的图像特征对;基于获得的各图像特征对各自包含的两个图像特征之间的差异,调整所述文本分类模型的模型参数。训练过程中,不需要大量的标注有文本类别的样本图像参与训练,避免样本图像不足而造成训练出的目标本文分类模型的分类准确性和分类可靠性较低的问题。

    图像处理方法、装置、计算机设备以及存储介质

    公开(公告)号:CN114328679A

    公开(公告)日:2022-04-12

    申请号:CN202111232728.3

    申请日:2021-10-22

    IPC分类号: G06F16/25 G06F16/28

    摘要: 本申请实施例公开了一种图像处理方法、装置、计算机设备以及存储介质。图像处理方法包括:获取待识别图像,对待识别图像进行字符识别处理,得到识别结果;其中,识别结果包括识别到的数据序列,数据序列包括字符序列、图像序列和位置序列中的一个或多个;基于数据序列的多模态特征序列对数据序列进行序列标注处理,得到数据序列中每个数据的结构化类别;根据数据序列和数据序列中每个数据的结构化类别,创建与待识别图像对应的结构化文档。采用本申请,可以提升将图片转换为结构化文档的效率和准确率。

    一种文本字符的识别方法、装置以及存储介质

    公开(公告)号:CN116978021A

    公开(公告)日:2023-10-31

    申请号:CN202211144562.4

    申请日:2022-09-20

    摘要: 本申请公开了一种文本字符的识别方法、装置以及存储介质,可应用于包含字符识别的地图或车联网场景中。通过获取提取待识别图像中的字符特征;并根据预设包围框配置检索向量;然后将检索向量与字符特征对应的编码向量进行关联得到目标文本特征;进而基于目标文本特征进行解码,以根据解码后的特征信息识别得到待识别图像对应的文本内容信息以及字符位置信息。从而实现基于字符粒度的文本字符识别过程,由于采用包围框对文本字符进行字符定位,并在字符对齐后进行识别,避免了字符之间的相互干扰,提高了文本字符的准确性。

    汉字生成方法、装置和计算机设备

    公开(公告)号:CN115906771A

    公开(公告)日:2023-04-04

    申请号:CN202110945000.9

    申请日:2021-08-17

    IPC分类号: G06F40/154 G06F40/14

    摘要: 本申请涉及一种汉字生成方法、装置、计算机设备和存储介质。方法包括:获取与待生成汉字对应的多于一个部件和至少一个形体结构;基于部件和形体结构生成与待生成汉字对应的多叉树;多叉树的叶子节点对应各个部件,非叶子节点对应各个形体结构;基于多叉树中各节点间的父子关系,确定多叉树中的至少一个多元组;每个多元组包括一个父节点和至少两个子节点;按照从多叉树的叶子节点至根节点的方向,依次遍历多元组并基于遍历至的多元组进行编码处理,直至达到根节点为止,得到汉字表征;获取与目标字体风格对应的目标字体表征,并基于汉字表征和目标字体表征,生成目标汉字。采用本方法能够提高汉字生成的效率。

    视频数据处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN114782853A

    公开(公告)日:2022-07-22

    申请号:CN202110013621.3

    申请日:2021-01-06

    摘要: 本申请涉及一种视频数据处理方法、装置、计算机设备和存储介质。所述方法包括:获取包含待鉴别证件的视频帧序列;确定所述待鉴别证件在所述视频帧序列中的位置;根据所述待鉴别证件在所述视频帧序列中的位置,确定所述待鉴别证件在所述视频帧序列中的多个位置状态;将各个所述位置状态分别与预设动作对应的目标位置状态进行匹配,将匹配成功的位置状态对应的视频帧确定为待鉴别的候选关键帧;所述预设动作为使得标准证件的防伪点发生变化的动作,所述标准证件与所述待鉴别证件的类型一致;根据所述候选关键帧,确定所述待鉴别证件的鉴别结果。采用本方法能够扩展了证件真伪鉴别的应用范围。