-
公开(公告)号:CN118823802A
公开(公告)日:2024-10-22
申请号:CN202310557343.7
申请日:2023-05-17
申请人: 上海鹑火信息技术有限公司
发明人: 请求不公布姓名
IPC分类号: G06V30/26 , G06F40/166 , G06F40/103 , G06F40/109
摘要: 本发明公开了一种数字化视觉还原系统与方法,本发明中的视觉还原方法可以完美还原书籍的原有阅读体验,解决了传统OCR识别之后,会失去页面排版效果,影响阅读体验的问题。本发明的视觉还原方法可以应用于各种语言,比如藏文、高棉文等。本发明中经过视觉还原后的文本,可以被复制、编辑、搜索、翻译,还可以被导出成Word、PDF、图像等格式,方便书籍的数字化管理及存储。本发明增加了编辑模块,可在校对的过程中,像word一样对文字字体、文字大小(字号)、文字颜色、书籍背景颜色、文字方向、句子位置(坐标)、页眉与页脚、识别内容等进行可视化编辑修改。
-
公开(公告)号:CN114842487B
公开(公告)日:2023-11-03
申请号:CN202210262353.3
申请日:2022-03-16
申请人: 上海鹑火信息技术有限公司
发明人: 请求不公布姓名
IPC分类号: G06V30/40 , G06V30/14 , G06V30/19 , G06V10/80 , G06V10/82 , G06V10/764 , G06N3/0464 , G06N3/047 , G06N3/0442 , G06N3/084 , G06N3/088
摘要: 本发明提供一种婆罗米系文字的识别方法,用于输入图像的文本识别,包括检测步骤、识别文本步骤,其中,检测步骤包括:1.输入图像,图像进入检测模块;2.检测模块对图像中的文字区域进行描述,描述形式为多边形顶点坐标;3.将描述完毕的文字区域图提取出来经过变换得到规则形状的图像;识别文本步骤,包括:4.将多边形图像传入识别模块得到文本数据;其中,检测模块内设有用于提取图像特征的第一主干神经网络,识别模块内设有第二主干神经网络。本发明提供的一种婆罗米系文字的识别方法及系统,解决了传统OCR对部分婆罗米系文字不能正确识别的问题,有很好的市场前景。
-