-
公开(公告)号:CN117132997B
公开(公告)日:2024-03-12
申请号:CN202311398545.8
申请日:2023-10-26
Applicant: 国网江西省电力有限公司电力科学研究院 , 国家电网有限公司 , 南昌科晨电力试验研究有限公司 , 国网江西省电力有限公司
IPC: G06V30/22 , G06V30/16 , G06V30/18 , G06V10/82 , G06N3/0442 , G06N3/045 , G06N3/044 , G06N3/042 , G06N3/08 , G06N5/022 , G06N3/0464 , G06V30/164 , G06V30/162
Abstract: 本发明公开了一种基于多头注意力机制和知识图谱的手写表格识别方法,该方法对输入的手写表格图像进行预处理;然后进行特征提取得到手写表格图像特征图;通过CRNN模型对手写表格图像特征图进行序列标注,将手写表格图像特征图上的每个位置上的文字或标签视为一个序列标注任务;通过解码算法将序列标注得到的序列标签转化为识别结果,最后通过电力知识图谱模型将识别结果进行逻辑梳理,并将识别到的内容按照表格的结构进行聚合、整理和转换,得到最终所需表格模板的规范表格数据。本发明结合了CRNN网络、多头自注意力机制和知识图谱的优势,提高了手写表格识别和生成的准确性和效果。
-
公开(公告)号:CN117132997A
公开(公告)日:2023-11-28
申请号:CN202311398545.8
申请日:2023-10-26
Applicant: 国网江西省电力有限公司电力科学研究院 , 国家电网有限公司 , 南昌科晨电力试验研究有限公司 , 国网江西省电力有限公司
IPC: G06V30/22 , G06V30/16 , G06V30/18 , G06V10/82 , G06N3/0442 , G06N3/045 , G06N3/044 , G06N3/042 , G06N3/08 , G06N5/022 , G06N3/0464 , G06V30/164 , G06V30/162
Abstract: 本发明公开了一种基于多头注意力机制和知识图谱的手写表格识别方法,该方法对输入的手写表格图像进行预处理;然后进行特征提取得到手写表格图像特征图;通过CRNN模型对手写表格图像特征图进行序列标注,将手写表格图像特征图上的每个位置上的文字或标签视为一个序列标注任务;通过解码算法将序列标注得到的序列标签转化为识别结果,最后通过电力知识图谱模型将识别结果进行逻辑梳理,并将识别到的内容按照表格的结构进行聚合、整理和转换,得到最终所需表格模板的规范表格数据。本发明结合了CRNN网络、多头自注意力机制和知识图谱的优势,提高了手写表格识别和生成的准确性和效果。
-