- 专利标题: 神经网络训练方法、文档图像理解方法、装置和设备
-
申请号: CN202111493576.2申请日: 2021-12-08
-
公开(公告)号: CN114155543B公开(公告)日: 2022-11-29
- 发明人: 彭启明 , 罗斌 , 曹宇慧 , 冯仕堃 , 陈永锋
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京市汉坤律师事务所
- 代理商 姜浩然; 吴丽丽
- 主分类号: G06V30/41
- IPC分类号: G06V30/41 ; G06N3/04 ; G06N3/08
摘要:
本公开提供了一种神经网络训练方法、文档图像理解方法、装置和设备,涉及人工智能领域,具体涉及计算机视觉技术、图像处理技术、文字识别技术、自然语言处理技术和深度学习技术。训练方法包括:获取原始图像中的多个第一文本的文本综合特征;将原始图像中的至少一个原始区域进行替换,以得到包括多个第一区域的样本图像和指示每个第一区域是否是被替换的区域的真实标签;获取多个第一区域的图像综合特征;将多个第一文本的文本综合特征和多个第一区域的图像综合特征同时输入神经网络模型,以得到多个第一文本的文本表示特征;基于多个第一文本的文本表示特征,确定预测标签;以及基于真实标签和预测标签,训练神经网络模型。
公开/授权文献
- CN114155543A 神经网络训练方法、文档图像理解方法、装置和设备 公开/授权日:2022-03-08