一种基于多头注意力机制和知识图谱的手写表格识别方法
Abstract:
本发明公开了一种基于多头注意力机制和知识图谱的手写表格识别方法,该方法对输入的手写表格图像进行预处理;然后进行特征提取得到手写表格图像特征图;通过CRNN模型对手写表格图像特征图进行序列标注,将手写表格图像特征图上的每个位置上的文字或标签视为一个序列标注任务;通过解码算法将序列标注得到的序列标签转化为识别结果,最后通过电力知识图谱模型将识别结果进行逻辑梳理,并将识别到的内容按照表格的结构进行聚合、整理和转换,得到最终所需表格模板的规范表格数据。本发明结合了CRNN网络、多头自注意力机制和知识图谱的优势,提高了手写表格识别和生成的准确性和效果。
Patent Agency Ranking
0/0