-
公开(公告)号:CN117333882A
公开(公告)日:2024-01-02
申请号:CN202311298964.4
申请日:2023-10-07
申请人: 华中科技大学
IPC分类号: G06V30/19 , G06V30/148 , G06V30/18 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/088
摘要: 本发明提出一种基于深度学习的甲骨文部首拆分匹配方法,包括以下步骤:首先收集甲骨文与对应汉字图像数据,使用汉字识别工具得到标签;然后在部首拆分模块中,甲骨文图像经过调整后分割得到甲骨文部首图像,用于训练甲骨文特征提取模块;接着在部首匹配模块中,根据部首图像间的特征相似度与已破译汉字IDS序列,将甲骨文部首匹配对应的汉字部首;最后在组合破译模块中,提取甲骨文图像结构信息,结合匹配的汉字部首,寻找与之匹配的IDS序列,破译得到汉字。本发明使用无监督对比学习网络作为特征提取模块,结合IDS序列,能够在没有甲骨文部首对应汉字部首标签的情况下学习两者对应关系,完成甲骨文的分解破译。
-
公开(公告)号:CN117333883A
公开(公告)日:2024-01-02
申请号:CN202311298972.9
申请日:2023-10-07
申请人: 华中科技大学
摘要: 本发明提出了一种基于深度学习和表意文字描述序列的多种类汉字识别方法,包括以下步骤:首先利用汉字表意文字描述序列,生成已有近九万种汉字以及随机生成不存在的汉字的图像数据,然后将图像数据经过大量数据增强后通过残差网络,并采用改进后的交叉损失函数进行训练,最后对于输入图片进行多种类汉字的识别。本发明通过输入种类繁多的汉字图像以及不断随机生成不存在的新汉字图像,利用深度的残差网络和改进后的交叉熵损失函数进行训练,这样的训练方式不仅增强了对生僻字的识别能力,还实现了对隶定字的有效区分。
-
公开(公告)号:CN117333881A
公开(公告)日:2024-01-02
申请号:CN202311295878.8
申请日:2023-10-07
申请人: 华中科技大学
IPC分类号: G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/084
摘要: 本发明公开了一种基于条件扩散模型的甲骨文辅助破译方法:收集和整理已破译的甲骨文文字在甲骨文、金文、大篆、隶书和楷书五个阶段的字形演变数据;将两个不同时期的文字图片进行配对,并进行固定尺寸的随机裁剪操作;构建一个条件扩散模型神经网络,将成对图片送入神经网络中进行训练,优化网络参数;输入一张甲骨文文字图片,利用训练好的条件扩散模型对图片进行逆向扩散,并使用加权滑动方法生成甲骨文字形演变图片。本发明提出了一个简单而有效的甲骨文字形演变生成模型,利用已破译甲骨文不同时期文字图片的监督信息,达到了输入甲骨文图片,模型能够预测生成其在任意时期的字形图片的目的,从而辅助甲骨文专家对未破译的甲骨文进行破译。
-
公开(公告)号:CN117315686A
公开(公告)日:2023-12-29
申请号:CN202311287573.2
申请日:2023-10-07
申请人: 华中科技大学
摘要: 本发明公开了一种基于分类模型的甲骨文辅助破译分类方法,该方法包括:获取数据源,并基于所述数据源进行数据集的划分;训练分类模型,其中包括:将训练集输入训练模型中训练,在训练过程中,对训练集每一组图像中不同时期汉字图像进行特征系数加权;每轮训练结束后,输出由验证集得到的模型性能评估参数,根据这些参数的优劣筛选得到的分类模型;所有训练结束后,将测试集中的图片去除标签作为未破译甲骨文置于所述分类模型中进行预测,输出预测正确率高于预设数值的结果;基于分类模型,进行未破译甲骨文的分类和辅助破译。本方法方便地实现了甲骨文辅助破译的分类范式。本发明还提供了相应的基于分类模型的甲骨文辅助破译分类系统。
-
-
-