神经网络训练方法、文档图像理解方法、装置和设备
摘要:
本公开提供了一种神经网络训练方法、文档图像理解方法、装置和设备,涉及人工智能领域,具体涉及计算机视觉技术、图像处理技术、文字识别技术、自然语言处理技术和深度学习技术。训练方法包括:获取原始图像中的多个第一文本的文本综合特征;将原始图像中的至少一个原始区域进行替换,以得到包括多个第一区域的样本图像和指示每个第一区域是否是被替换的区域的真实标签;获取多个第一区域的图像综合特征;将多个第一文本的文本综合特征和多个第一区域的图像综合特征同时输入神经网络模型,以得到多个第一文本的文本表示特征;基于多个第一文本的文本表示特征,确定预测标签;以及基于真实标签和预测标签,训练神经网络模型。
0/0