一种古籍识别方法、装置、存储介质及设备

    公开(公告)号:CN115147852A

    公开(公告)日:2022-10-04

    申请号:CN202210258636.0

    申请日:2022-03-16

    摘要: 本申请公开了一种古籍识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标古籍图像;并利用骨干网络对其进行分类特征提取,得到骨干分类特征,然后对骨干分类特征进行检测,确定目标古籍图像包含的单字位置和文本行位置;接着,对单字位置进行识别,得到单字的内容信息;以及对文本行位置进行预测,得到文本行位置中的文字的阅读顺序,进而可以根据单字位置与文本行位置的比例关系,将单字的内容信息按照文本行位置中的文字的阅读顺序进行排列,得到目标古籍图像中文字的识别结果。可见,由于本申请是通过将古籍图像中单字的位置和内容,与文本行的位置和文字阅读方向进行聚合,从而提高了识别准确率和识别效率。

    文本识别方法、装置、可读介质及电子设备

    公开(公告)号:CN114118079A

    公开(公告)日:2022-03-01

    申请号:CN202111316302.6

    申请日:2021-11-08

    IPC分类号: G06F40/289

    摘要: 本公开涉及一种文本识别方法、装置、可读介质及电子设备,所述方法包括:获取待识别的文本图像;将所述文本图像输入预先训练的文本识别模型,输出所述文本图像对应的文本内容和所述文本内容中每个字符的位置信息。也就是说,本公开可以通过一个文本识别模型识别文本图像的文本内容,并确定该文本内容中每个字符的位置信息,这样,提高了文本识别的效果。

    笔划识别方法、装置、可读介质及电子设备

    公开(公告)号:CN113128470A

    公开(公告)日:2021-07-16

    申请号:CN202110524508.1

    申请日:2021-05-13

    IPC分类号: G06K9/00 G06N3/04 G06N3/08

    摘要: 本公开涉及一种笔划识别方法、装置、可读介质及电子设备,包括:获取包括手写字的原始图像;提取原始图像中各个手写字对应的图像信息;将各个手写字对应的图像信息输入笔划处理模型中,以分别识别各个手写字的笔顺。这样,通过预先训练好的笔划处理模型不仅能够从离线拍摄的任意手写字图像中确定手写字的笔划,而且还能确定出各笔划的书写顺序,无需用户在能够获取到用户书写信息等具有特定功能的书写设备上进行练字,也无需分别通过汉字的书写规则对手写字中拆解到的各个笔划进行组合才能获得原始图像中的各个手写字的笔顺,这样能够使得确定图像中的手写字的笔顺的过程更加快捷且结果更加精准。

    关键帧去重的方法、装置和电子设备

    公开(公告)号:CN112487943B

    公开(公告)日:2023-06-27

    申请号:CN202011351111.9

    申请日:2020-11-25

    IPC分类号: G06V20/40 G06V20/62

    摘要: 本公开实施例公开了关键帧去重的方法、装置和电子设备。该方法的一具体实施方式包括:获取视频的关键帧集合和关键帧集合中每个关键帧中的文字区域;提取每个关键帧中文字区域的特征点;利用文字区域的特征点,从关键帧集合中提取出相似的关键帧,生成关键帧子集合;对关键帧子集合中的关键帧进行去重。该实施方式实现了对视频中冗余的关键帧的去除。

    信息输出方法、装置和电子设备

    公开(公告)号:CN112699272B

    公开(公告)日:2024-01-30

    申请号:CN202110015895.6

    申请日:2021-01-06

    IPC分类号: G06F16/78 G06F16/783

    摘要: 本公开实施例公开了信息输出方法、装置和电子设备。该方法的一具体实施方式包括:响应于接收到针对视频中的文字进行搜索的搜索词,获取视频的视频文本识别结果;基于搜索词与视频文本识别结果中的各个单词的相似度,从视频文本识别结果中选取单词作为目标单词;获取呈现有目标单词的视频帧,从视频帧中选取符合预设条件的视频帧作为目标视频帧;基于搜索词和目标视频帧中呈现的文本,生成纠正后的文本进行输出。该实施方式即使在视频的文本识别结果出现错误时,也可以准确地检索到正确结果。

    笔划识别方法、装置、可读介质及电子设备

    公开(公告)号:CN113128470B

    公开(公告)日:2023-04-07

    申请号:CN202110524508.1

    申请日:2021-05-13

    摘要: 本公开涉及一种笔划识别方法、装置、可读介质及电子设备,包括:获取包括手写字的原始图像;提取原始图像中各个手写字对应的图像信息;将各个手写字对应的图像信息输入笔划处理模型中,以分别识别各个手写字的笔顺。这样,通过预先训练好的笔划处理模型不仅能够从离线拍摄的任意手写字图像中确定手写字的笔划,而且还能确定出各笔划的书写顺序,无需用户在能够获取到用户书写信息等具有特定功能的书写设备上进行练字,也无需分别通过汉字的书写规则对手写字中拆解到的各个笔划进行组合才能获得原始图像中的各个手写字的笔顺,这样能够使得确定图像中的手写字的笔顺的过程更加快捷且结果更加精准。

    练字格检测方法、装置、可读介质及电子设备

    公开(公告)号:CN113033539B

    公开(公告)日:2022-12-06

    申请号:CN202110341076.0

    申请日:2021-03-30

    IPC分类号: G06V30/14 G06V30/19

    摘要: 本公开涉及一种练字格检测方法、装置、可读介质及电子设备,包括:获取目标图像;根据预先训练好的练字格检测模型确定目标图像中的各个练字格的位置信息及练字格类型,练字格类型为完整且含字的练字格、完整且不含字的练字格、不完整且含字的练字格、不完整且不含字的练字格中的任一者。通过上述技术方案,能够对任意练字格纸张上的练字格进行位置和类型判断,这样不仅使得用户能够清楚地得到该目标图像中的练字状态,而且还能便于后续对用户的书写内容进行剪裁等操作,而且对练字格类型的判断结果还可以用于智能检测练字完成率,或者提醒用户是否需要重新拍摄等,因此大大提高了用户体验。

    一种图像检测方法、装置、存储介质及设备

    公开(公告)号:CN114332836A

    公开(公告)日:2022-04-12

    申请号:CN202111604852.8

    申请日:2021-12-24

    摘要: 本申请公开了一种图像检测方法、装置、存储介质及设备,该方法包括:首先对获取到的目标图像进行检测,得到包含文本行位置的二值图和包含单字位置的二值图,然后对包含文本行位置的二值图中的文本行进行标记,得到各个文本行对应的标识;并确定各个文本行所在位置中各个像素点的坐标值,以及计算包含单字位置的二值图中各个单字所在位置的中心位置的像素点坐标值;接着,将各个单字所在位置的中心位置的像素点坐标值与各个文本行所在位置中各个像素点的坐标值进行匹配,确定各个单字所属的文本行标识,进而可以将各个单字填充到对应标识的文本行中,以实现文本行所在位置和单字所在位置的精准匹配,从而提高了检测结果的准确性和检测效率。

    一种文本行方向确定方法及其相关设备

    公开(公告)号:CN113191345A

    公开(公告)日:2021-07-30

    申请号:CN202110468072.9

    申请日:2021-04-28

    IPC分类号: G06K9/20 G06K9/32

    摘要: 本申请公开了一种文本行方向确定方法及其相关设备,在获取到待处理图像之后,先确定该待处理图像中待处理文本行的全局区域和该待处理文本行的局部区域,以使该待处理文本行的全局区域表示该待处理文本行在该待处理图像内所占区域,以及该待处理文本行的局部区域表示该待处理文本行的预设部分在该待处理图像内所占区域;再将该待处理文本行的全局区域与该待处理文本行的局部区域进行位置比较,得到该待处理文本行的文本行方向。如此能够实现准确地确定出图像中文本行的文本行方向,从而有利于提高图像中文本行的字符识别准确性。

    一种图像检测方法、装置、存储介质及设备

    公开(公告)号:CN114332836B

    公开(公告)日:2024-11-01

    申请号:CN202111604852.8

    申请日:2021-12-24

    IPC分类号: G06V20/62 G06V10/75 G06V10/28

    摘要: 本申请公开了一种图像检测方法、装置、存储介质及设备,该方法包括:首先对获取到的目标图像进行检测,得到包含文本行位置的二值图和包含单字位置的二值图,然后对包含文本行位置的二值图中的文本行进行标记,得到各个文本行对应的标识;并确定各个文本行所在位置中各个像素点的坐标值,以及计算包含单字位置的二值图中各个单字所在位置的中心位置的像素点坐标值;接着,将各个单字所在位置的中心位置的像素点坐标值与各个文本行所在位置中各个像素点的坐标值进行匹配,确定各个单字所属的文本行标识,进而可以将各个单字填充到对应标识的文本行中,以实现文本行所在位置和单字所在位置的精准匹配,从而提高了检测结果的准确性和检测效率。