一种数字化视觉还原系统与方法
    1.
    发明公开

    公开(公告)号:CN118823802A

    公开(公告)日:2024-10-22

    申请号:CN202310557343.7

    申请日:2023-05-17

    摘要: 本发明公开了一种数字化视觉还原系统与方法,本发明中的视觉还原方法可以完美还原书籍的原有阅读体验,解决了传统OCR识别之后,会失去页面排版效果,影响阅读体验的问题。本发明的视觉还原方法可以应用于各种语言,比如藏文、高棉文等。本发明中经过视觉还原后的文本,可以被复制、编辑、搜索、翻译,还可以被导出成Word、PDF、图像等格式,方便书籍的数字化管理及存储。本发明增加了编辑模块,可在校对的过程中,像word一样对文字字体、文字大小(字号)、文字颜色、书籍背景颜色、文字方向、句子位置(坐标)、页眉与页脚、识别内容等进行可视化编辑修改。

    一种婆罗米系文字的识别方法及系统

    公开(公告)号:CN114842487B

    公开(公告)日:2023-11-03

    申请号:CN202210262353.3

    申请日:2022-03-16

    摘要: 本发明提供一种婆罗米系文字的识别方法,用于输入图像的文本识别,包括检测步骤、识别文本步骤,其中,检测步骤包括:1.输入图像,图像进入检测模块;2.检测模块对图像中的文字区域进行描述,描述形式为多边形顶点坐标;3.将描述完毕的文字区域图提取出来经过变换得到规则形状的图像;识别文本步骤,包括:4.将多边形图像传入识别模块得到文本数据;其中,检测模块内设有用于提取图像特征的第一主干神经网络,识别模块内设有第二主干神经网络。本发明提供的一种婆罗米系文字的识别方法及系统,解决了传统OCR对部分婆罗米系文字不能正确识别的问题,有很好的市场前景。