神经网络训练方法、文档图像理解方法、装置和设备

发明授权

CN114155543B 神经网络训练方法、文档图像理解方法、装置和设备有权

请登陆查看更多内容

专利标题： 神经网络训练方法、文档图像理解方法、装置和设备
申请号： CN202111493576.2

申请日： 2021-12-08
公开(公告)号： CN114155543B

公开(公告)日： 2022-11-29
发明人: 彭启明 , 罗斌 , 曹宇慧 , 冯仕堃 , 陈永锋
申请人： 北京百度网讯科技有限公司
申请人地址： 北京市海淀区上地十街10号百度大厦2层
专利权人： 北京百度网讯科技有限公司
当前专利权人： 北京百度网讯科技有限公司
当前专利权人地址： 北京市海淀区上地十街10号百度大厦2层
代理机构： 北京市汉坤律师事务所
代理商 姜浩然; 吴丽丽
主分类号： G06V30/41
IPC分类号： G06V30/41 ; G06N3/04 ; G06N3/08

摘要：

本公开提供了一种神经网络训练方法、文档图像理解方法、装置和设备，涉及人工智能领域，具体涉及计算机视觉技术、图像处理技术、文字识别技术、自然语言处理技术和深度学习技术。训练方法包括：获取原始图像中的多个第一文本的文本综合特征；将原始图像中的至少一个原始区域进行替换，以得到包括多个第一区域的样本图像和指示每个第一区域是否是被替换的区域的真实标签；获取多个第一区域的图像综合特征；将多个第一文本的文本综合特征和多个第一区域的图像综合特征同时输入神经网络模型，以得到多个第一文本的文本表示特征；基于多个第一文本的文本表示特征，确定预测标签；以及基于真实标签和预测标签，训练神经网络模型。

公开/授权文献

CN114155543A 神经网络训练方法、文档图像理解方法、装置和设备公开/授权日：2022-03-08

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V30/00	字符识别；数字墨迹识别；面向文档的基于图像的模式识别（文档等的扫描、传输或复制 H04N1/00）
G06V30/40	.面向文档的基于图像的模式识别
G06V30/41	..文件内容分析（基于代码标记的印刷字符识别G06V30/224）