通过神经网络模型进行文档图像处理的方法及装置
摘要:
本公开提供一种通过神经网络模型进行文档图像处理的方法及装置,神经网络模型预先通过整体训练得到,其中至少包括匹配预测网络和逻辑交互网络,方法包括:从包含文档内容的目标图像中识别出多个文字;对于多个文字中任意两个文字构成的文字组合,使用匹配预测网络,得到文字组合属于同一语义字段的第一概率;在逻辑交互网络中,根据与文档理解相关的若干条约束规则,更新各个文字组合对应的第一概率,得到各个文字组合对应的第二概率;基于各个文字组合对应的第二概率,确定多个文字各自所属的语义字段。该实施方式使用包括约束规则的神经网络模型确定文档图像中多个文字各自所属(56)对比文件孙忠严.“逻辑规则增强的中医实体表示学习与应用研究”《.中国优秀硕士学位论文全文数据库 医药卫生科技辑》.2023,第2023年卷(第10期),第E056-3页.Rinon Gal et.al..“Cardinal graphconvolution framework for documentinformation extraction”《.Proceedings ofthe ACM Symposium on Document Engineering2020》.2020,第7卷第1–11页.张雪;孙宏宇;辛东兴;李翠平;陈红.自动术语抽取研究综述.软件学报.2020,(第07期),第136-168页.
0/0