-
公开(公告)号:CN109460735B
公开(公告)日:2021-02-02
申请号:CN201811334371.8
申请日:2018-11-09
申请人: 中国科学院自动化研究所 , 富士通株式会社
摘要: 本发明属于模式识别领域,具体涉及一种基于图半监督学习的文档二值化处理方法、系统、装置,旨在为了解决古籍文档文本识别准确度较低的问题。本发明方法包括:获取待处理的图像;降采样和k近邻法构图;基于分别从前景和背景中选取样本点作为标记的种子点;采用图半监督学习方法进行结点分类;基于前景结点进行图像恢复;对恢复后的图像进行二值化,得到二值化的图像。本发明可以较好地保留文字的纤细笔画,不仅提提高了文字识别的准确度、也提高了文字细节识别的准确度,对于光照不均和背景复杂的图像也有较好的鲁棒性,同时降采样提高了半监督学习算法求解过程的运行速度。
-
公开(公告)号:CN109460735A
公开(公告)日:2019-03-12
申请号:CN201811334371.8
申请日:2018-11-09
申请人: 中国科学院自动化研究所 , 富士通株式会社
摘要: 本发明属于模式识别领域,具体涉及一种基于图半监督学习的文档二值化处理方法、系统、装置,旨在为了解决古籍文档文本识别准确度较低的问题。本发明方法包括:获取待处理的图像;降采样和k近邻法构图;基于分别从前景和背景中选取样本点作为标记的种子点;采用图半监督学习方法进行结点分类;基于前景结点进行图像恢复;对恢复后的图像进行二值化,得到二值化的图像。本发明可以较好地保留文字的纤细笔画,不仅提提高了文字识别的准确度、也提高了文字细节识别的准确度,对于光照不均和背景复杂的图像也有较好的鲁棒性,同时降采样提高了半监督学习算法求解过程的运行速度。
-
公开(公告)号:CN118644435A
公开(公告)日:2024-09-13
申请号:CN202410541268.X
申请日:2024-04-30
申请人: 中国科学院自动化研究所
IPC分类号: G06T5/92 , G06T5/94 , G06T5/60 , G06N3/0464 , G06N3/0455 , G06N3/09 , G06N3/0475 , G06N3/0442 , G06N3/094 , G06V10/44 , G06V10/42 , G06V10/80 , G06V10/52 , G06V10/82 , G06N3/048
摘要: 本发明提供一种文档图像高光去除方法、装置及电子设备,涉及图像处理技术领域,所述方法包括:将带有高光的文档图像输入训练好的高光去除模型,得到去除高光的文档图像;其中,训练好的高光去除模型包括训练好的全局预测模型和训练好的局部预测模型;训练好的全局预测模型用于对带有高光的文档图像进行全局信息捕获,得到初始去除高光的文档图像;训练好的局部预测模型用于对所述初始去除高光的文档图像进行局部信息捕获,得到残差图像;去除高光的文档图像是初始去除高光的文档图像和残差图像相加得到的。本发明实现了高效和精确去除文档图像的高光。
-
公开(公告)号:CN109685065B
公开(公告)日:2021-06-25
申请号:CN201811512183.X
申请日:2018-12-11
申请人: 中国科学院自动化研究所
摘要: 本发明提出一种试卷内容自动分类的版面分析方法及系统,所述方法包括:获取录入的文档图像;提取所述文档图像的连通部件构成原始联通部件集;根据文档图像的连通部件,对各连通部件进行文本和非文本的分类,获取第一文本连通部件集、非文本连通部件集;对非文本连通部件集中各连通部件,进行文字部件的检测和切分,获得粘连在非文本分类的连通部件中的文字部件,并将该部件增入第一文本连通部件集,得到第二文本连通部件集;对所述第二文本连通部件集中各连通部件,进行印刷体文字和手写体文字的分类;输出文档图像内容的分类结果。采用本发明的方法将元素的分类问题转化成了一个求解所有元素的联合概率最大的全局优化问题,从而可以提升整体的分类正确率。
-
公开(公告)号:CN102542268A
公开(公告)日:2012-07-04
申请号:CN201110451826.6
申请日:2011-12-29
申请人: 中国科学院自动化研究所
IPC分类号: G06K9/32
摘要: 一种用于视频中文本区域检测与定位的方法,其特征在于,包含如下步骤:输入视频,按等时间间隔对输入视频进行采样;对采样得到的图像进行边缘检测;利用检测后得到的图像生成文本置信度图;根据生成的文本置信度图提取文本候选区域;对文本候选区域近似相同的多帧图像的文本候选区域进行融合;对融合后的文本区域图像进行分行。本发明的文本检测与定位方法能够实时地对视频中出现的多语言文本进行准确定位。可以适用于视频内容编辑、索引与检索等多种用途。
-
公开(公告)号:CN116863456A
公开(公告)日:2023-10-10
申请号:CN202310626483.5
申请日:2023-05-30
申请人: 中国科学院自动化研究所
IPC分类号: G06V20/62 , G06V20/40 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/082
摘要: 本申请实施例提供一种视频文本识别方法、装置及存储介质。该方法包括:获取待处理的视频图像;利用可变形自注意力机制对多种分辨率的所述视频图像进行特征融合,获得编码输出特征;基于所述编码输出特征利用自注意力机制确定文本识别结果。本申请实施例提供的视频文本识别方法、装置及存储介质,利用可变形自注意力机制将高分辨率特征图与低分辨率特征图的融合,实现了对小目标的检测和识别,提高了视频文本识别的准确性。
-
公开(公告)号:CN116152841A
公开(公告)日:2023-05-23
申请号:CN202310425886.3
申请日:2023-04-20
申请人: 中国科学院自动化研究所
IPC分类号: G06V30/413 , G06V30/414 , G06V20/70 , G06V30/19 , G06V10/82 , G06V30/18
摘要: 本申请提供一种文档实体及关系抽取方法、装置及存储介质,属于计算机视觉和自然语言处理技术领域,该方法包括:确定图结构的顶点的视觉特征和所述图结构的边的视觉特征;所述图结构以文档中的实体为顶点,以所述实体的外接框之间的连线为边;基于所述顶点的视觉特征和所述边的视觉特征确定文档实体信息;所述文档实体信息包括文档中的实体的布局关系、所述实体的类别信息和所述实体之间的语义关系。本申请实施例提供的文档实体及关系抽取方法、装置及存储介质,基于图结构中顶点的视觉特征和边的视觉特征进行顶点分类和边分类,获得文档实体的布局关系、实体类别和实体间的语义关系,使得视觉富文档实体信息的提取更加全面和准确。
-
公开(公告)号:CN116152841B
公开(公告)日:2024-09-24
申请号:CN202310425886.3
申请日:2023-04-20
申请人: 中国科学院自动化研究所
IPC分类号: G06V30/413 , G06V30/414 , G06V20/70 , G06V30/19 , G06V10/82 , G06V30/18
摘要: 本申请提供一种文档实体及关系抽取方法、装置及存储介质,属于计算机视觉和自然语言处理技术领域,该方法包括:确定图结构的顶点的视觉特征和所述图结构的边的视觉特征;所述图结构以文档中的实体为顶点,以所述实体的外接框之间的连线为边;基于所述顶点的视觉特征和所述边的视觉特征确定文档实体信息;所述文档实体信息包括文档中的实体的布局关系、所述实体的类别信息和所述实体之间的语义关系。本申请实施例提供的文档实体及关系抽取方法、装置及存储介质,基于图结构中顶点的视觉特征和边的视觉特征进行顶点分类和边分类,获得文档实体的布局关系、实体类别和实体间的语义关系,使得视觉富文档实体信息的提取更加全面和准确。
-
公开(公告)号:CN109543777B
公开(公告)日:2020-10-27
申请号:CN201811433192.X
申请日:2018-11-28
申请人: 中国科学院自动化研究所
摘要: 本发明涉及一种手写汉字书写质量评价方法及系统,所述评价方法包括:获取待评价手写汉字图像;去除所述待评价手写汉字图像中的田字格,得到字体图像;对所述字体图像进行灰度化处理,得到灰度图像;对所述灰度图像进行透视化处理得到变换图像;将变换图像分割成多个单个的汉字;通过卷积神经网络对各个汉字进行评价,确定待评价手写汉字图像的书写质量。本发明通过待评价手写汉字图像依次进行去除田字格处理、灰度处理、透视化处理、分割处理,通过卷积神经网络对单个汉字进行评价,从而确定待评价手写汉字图像的书写质量,整个过程减少人为的参与,全程机器化、全自动处理,从而可提高书写质量评价的准确性。
-
公开(公告)号:CN109543777A
公开(公告)日:2019-03-29
申请号:CN201811433192.X
申请日:2018-11-28
申请人: 中国科学院自动化研究所
摘要: 本发明涉及一种手写汉字书写质量评价方法及系统,所述评价方法包括:获取待评价手写汉字图像;去除所述待评价手写汉字图像中的田字格,得到字体图像;对所述字体图像进行灰度化处理,得到灰度图像;对所述灰度图像进行透视化处理得到变换图像;将变换图像分割成多个单个的汉字;通过卷积神经网络对各个汉字进行评价,确定待评价手写汉字图像的书写质量。本发明通过待评价手写汉字图像依次进行去除田字格处理、灰度处理、透视化处理、分割处理,通过卷积神经网络对单个汉字进行评价,从而确定待评价手写汉字图像的书写质量,整个过程减少人为的参与,全程机器化、全自动处理,从而可提高书写质量评价的准确性。
-
-
-
-
-
-
-
-
-