-
公开(公告)号:CN111950548B
公开(公告)日:2023-07-28
申请号:CN202010793534.X
申请日:2020-08-10
申请人: 河南大学
IPC分类号: G06V20/62 , G06V30/19 , G06V10/75 , G06V10/764 , G06N3/0464 , G06V10/82 , G06N3/08
摘要: 本发明公开了一种引入字库文字图像进行深度模板匹配的汉字识别方法,包括以下步骤:A:对汉字矢量字库中每个文字,得到字库文字图像及对应的文字内容;B:对汉字矢量字库中每个文字,获取该文字对应的真实字符图像集合;C:设置训练模型及参数;D:随机挑选K组文字内容相同或不同的字库文字图像和真实字符图像的组合,利用双通道孪生神经网络对模型进行训练并得到更新后的文字识别模型;E:创建键值对数据结构并读取拟预测真实字符图像;F:利用更新后的文字识别模型,将拟预测真实字符图像与汉字矢量字库中的所有字库文字图像比对并输出结果。本发明极大地降低了汉字识别的难度,提高了汉字识别的准确率。
-
公开(公告)号:CN116246280A
公开(公告)日:2023-06-09
申请号:CN202310178161.9
申请日:2023-02-28
申请人: 河南大学
IPC分类号: G06V30/19 , G06V30/18 , G06V10/42 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/0895
摘要: 本发明公开了一种多特征挖掘与协同约束的敦煌遗书残片缀合方法,包括以下步骤:A:对待缀合的敦煌遗书残片的图像进行预处理;B:构建多特征提取网络,包含异构特征挖掘模块、特征聚合模块和特征编码模块;C:利用对比学习模块优化多特征提取网络;D:将预处理后的待缀合敦煌遗书残片的图像,输入优化后的多特征提取网络进行关键特征的提取,并利用编码后的聚合特征判断得到多幅待缀合敦煌遗书残片的缀合匹配度。本发明利用多特征提取网络充分挖掘敦煌遗书残片的书写风格特征、文本布局特征、残边边缘特征和语句通顺性特征并进行聚合得到聚合特征,最终得到敦煌遗书残片的缀合匹配度,从而实现敦煌遗书残片的精准缀合。
-
公开(公告)号:CN111951152A
公开(公告)日:2020-11-17
申请号:CN202010793853.0
申请日:2020-08-10
申请人: 河南大学
摘要: 本发明公开了一种兼顾原边连续性和断边碴口匹配度的甲骨缀合方法,包括以下步骤:A:提取每幅甲骨拓片图像的边缘曲线图及原边的弧线走向线段;B:对每幅甲骨拓片图像进行方向调整;C:得到每幅甲骨拓片图像的时间序列化边缘曲线数据;D:进行归一化处理并得到归一化后的时间序列化边缘曲线数据;E:计算拟判定是否能够缀合的两幅甲骨拓片图像a和b的时间序列匹配度s并放入集合S中;F:求集合S中的最大值;G:依次执行步骤C至步骤F,计算每幅甲骨拓片图像与其它甲骨拓片图像之间的最大缀合度;选取与其最大缀合度最高的若干幅甲骨拓片图像作为该甲骨拓片图像的最佳缀合结果。本发明能够提高甲骨残片缀合的准确性。
-
公开(公告)号:CN103559209A
公开(公告)日:2014-02-05
申请号:CN201310470050.1
申请日:2013-10-10
申请人: 河南大学
发明人: 张重生
IPC分类号: G06F17/30
CPC分类号: G06F17/3087
摘要: 本发明公开了一种VoronoiDiagram与虚拟网格结合的高效空间最近邻查询方法,包括以下步骤:(1)使用VoronoiDiagram划分二维空间中的数据点,形成N个VoronoiCell;(2)使用虚拟网格将二维空间划分为若干个网格单元,确定网格单元的边长并进行编号;(3)设计计算虚拟网格单元和VoronoiCell之间的对应关系的方法,并存储在一个哈希表中;(4)计算查询点位置所在的网格单元,并确定对应的网格单元的编号;(5)在哈希表中查找查询点位置所在的网格单元所对应的VoronoiCell,并从中计算选择距离查询点位置最近的数据点返回给用户。本发明适用于大规模均匀分布的二维数据集,能够将空间最近邻查询的时间复杂度从O(logN)降低到O(1),极大地提高了空间最近邻查询的效率。
-
公开(公告)号:CN115587215B
公开(公告)日:2023-10-20
申请号:CN202211277112.2
申请日:2022-10-18
申请人: 河南大学
摘要: 本发明公开了一种基于语句通顺性的残断汉简图像缀合方法,包括以下步骤:A:对待缀合的汉简图像进行图像特征标注;B:构建训练集并训练得到调优训练后的BERT语言模型;C:针对指定的残断汉简图像A,通过对图像特征对比得到汉简图像A的待缀合比对组;D:利用调优训练后的BERT语言模型,将汉简图像A与汉简图像A的待缀合比对组内的汉简图像逐一进行语句通顺性检测,得到与汉简图像A语言通顺性最高的N个待选汉简图像,作为与汉简图像A缀合度最高的N个待选汉简图像。本发明能够基于汉简图像中文字的语句通顺性和汉简图像特征实现残断汉简图像的缀合,显著提高缀合效率及准确性。
-
公开(公告)号:CN115620057A
公开(公告)日:2023-01-17
申请号:CN202211276002.4
申请日:2022-10-18
申请人: 河南大学
IPC分类号: G06V10/764 , G06V10/74 , G06V10/82 , G06T7/73 , G06T7/13 , G06T3/40 , G06F16/583
摘要: 本发明公开了一种基于语句通顺性的敦煌遗书残片图像缀合方法,包括以下步骤:A:将残片图像按缺失类型进行分类;B:获取残片图像的列宽、列高和间隙;C:根据缺失类型是否对应对残片图像A与B进行判断;D:对残片图像A和B的列宽列高比的比值和列宽间隙比的比值进行判断;E:对等比放大后残片图像B与A的列高比值、间隙比值和列宽比值进行判断;F:利用笔迹判断神经网络模型判断残片图像A与B的笔迹相似度;G:对残片图像A和B进行边缘相似度计算和语句通顺性检测;H:所有待缀合残片图像比较完毕后,得到敦煌遗书残片图像A的所有备选缀合图像。本发明综合考虑待缀合残片图像文字内容的语句通顺性和边缘相似度,提高敦煌遗书残片图像缀合的效率和准确性。
-
公开(公告)号:CN111291750A
公开(公告)日:2020-06-16
申请号:CN202010072173.X
申请日:2020-01-21
申请人: 河南大学
摘要: 本发明公开了一种基于空间近邻关系的甲骨文自动标注方法,包括以下步骤:A:对甲骨字符进行定位;B:对甲骨字符图像进行识别;C:选取待定锚点甲骨字;D:选取锚点甲骨字符图像;E:判断锚点甲骨字在甲骨字原文中的位置,进入下一个甲骨字符图像和/或上一个甲骨字符图像搜索;F:进行下一个甲骨字符图像搜索;G:进行上一个甲骨字符图像搜索;H:进行下一个和上一个甲骨字符图像搜索;I:完成甲骨字符图像的字符级别的标注。本发明能够快速高效地实现甲骨文拓片图像的字符级别的标注,即在甲骨文拓片图像上自动定位出甲骨文字位置,并对应显示出相应的甲骨字。
-
公开(公告)号:CN106446964A
公开(公告)日:2017-02-22
申请号:CN201610919285.8
申请日:2016-10-21
申请人: 河南大学
IPC分类号: G06K9/62
CPC分类号: G06K9/6282
摘要: 本发明公开了一种增量式的梯度提升决策树更新方法,包括以下步骤:A:对增量数据集与原始数据集进行排序归并得到当前最新有序数据集;B:分别计算每个结点在当前最新有序数据集上的最新最佳分裂属性和分裂值;C:利用最新最佳分裂属性与新的数据块到来前该结点上最佳分裂属性的对比结果进行数据分类模型更新。本发明能够在新数据集批量到来的情况下,以增量式的方法快速更新已有数据分类模型,不需要重新训练一个新的梯度提升决策树分类模型,而是在现有模型的基础上进行更新,从而极大地减少了建立数据分类模型的时间,提高了模型的训练速度,节约了大量的时间成本。
-
公开(公告)号:CN105740860A
公开(公告)日:2016-07-06
申请号:CN201610059409.X
申请日:2016-01-28
申请人: 河南大学
CPC分类号: G06K9/325 , G06K9/4604 , G06K9/4652
摘要: 本发明公开了一种自然场景中商铺标牌汉字区域自动检测方法,包括以下步骤:A、获取反映采样区图像主要像素颜色的向量V1和V2;B、利用向量V1和V2确定原始图像的背景轮廓;C、将HSV颜色空间划分为黑色、白色、红色、黄色、绿色、青色、蓝色、品红八块颜色空间;D、对原始图像进行颜色分层,得到8张颜色分布二值图;E、对8张颜色分布二值图进行汉字连通域分析,获得8张文本行二值图;F、对各张文本行二值图中不符合汉字书写规则的文本行进行过滤,得到精化后的汉字区域;G、将不同颜色的精化汉字区域进行融合,获得原始图像中的汉字区域。本发明能够有效提高汉字区域检测的准确度,对基于自然场景下的汉字识别的应用具有重要意义。
-
公开(公告)号:CN111291750B
公开(公告)日:2023-03-24
申请号:CN202010072173.X
申请日:2020-01-21
申请人: 河南大学
IPC分类号: G06V30/146 , G06V30/148 , G06V30/19 , G06V30/30
摘要: 本发明公开了一种基于空间近邻关系的甲骨文自动标注方法,包括以下步骤:A:对甲骨字符进行定位;B:对甲骨字符图像进行识别;C:选取待定锚点甲骨字;D:选取锚点甲骨字符图像;E:判断锚点甲骨字在甲骨字原文中的位置,进入下一个甲骨字符图像和/或上一个甲骨字符图像搜索;F:进行下一个甲骨字符图像搜索;G:进行上一个甲骨字符图像搜索;H:进行下一个和上一个甲骨字符图像搜索;I:完成甲骨字符图像的字符级别的标注。本发明能够快速高效地实现甲骨文拓片图像的字符级别的标注,即在甲骨文拓片图像上自动定位出甲骨文字位置,并对应显示出相应的甲骨字。
-
-
-
-
-
-
-
-
-