-
公开(公告)号:CN114821603B
公开(公告)日:2023-09-01
申请号:CN202210211125.3
申请日:2022-03-03
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V30/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N3/044
摘要: 本公开提供了一种票据识别方法、装置、电子设备以及存储介质,涉及深度学习、模式识别领域,可以为:获取待识别的目标票据;分别对多个文本块在目标票据上的二维位置信息进行编码处理,得到多个编码结果;分别对多个编码结果进行图卷积处理,得到多个卷积结果;基于第一条件随机场模型对每个卷积结果进行识别,得到目标票据的文本块级别的第一预测结果,第一条件随机场模型与第二条件随机场模型之间协同训练,第二条件随机场模型用于对每个卷积结果进行识别,以得到目标票据的字级别的第二预测结果。避免了第二条件随机场模型引入的切分误差,在提升第二条件随机场模型的性能的同时,也促进了第一条件随机场模型的预测性能。
-
公开(公告)号:CN114495113A
公开(公告)日:2022-05-13
申请号:CN202210154579.1
申请日:2022-02-18
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V30/19 , G06V30/14 , G06V30/148 , G06V30/18 , G06V10/82 , G06N3/04 , G06N3/08 , G06F40/30 , G06F16/35 , G06K9/62
摘要: 本公开提供了一种文本分类方法、文本分类模型的训练方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及文字识别领域、深度学习领域和图像处理领域,可应用于提取文档信息等场景。文本分类方法的具体实现方案为:根据待处理图像的图像特征和待处理图像包括的多个字段,确定多个字段中每个字段的文本特征;根据多个字段的多个文本特征和多个字段在待处理图像中的多个位置信息,确定每个字段的结构特征;以及根据每个字段的文本特征和每个字段的结构特征,确定每个字段的类别。
-
公开(公告)号:CN114419640A
公开(公告)日:2022-04-29
申请号:CN202210183469.8
申请日:2022-02-25
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V30/412 , G06V30/19 , G06K9/62 , G06F40/242 , G06F40/289 , G06F40/30 , G06Q40/02
摘要: 本公开提供了一种文本处理方法、装置、电子设备及存储介质,涉及图像处理技术领域,尤其涉及计算机视觉领域。具体实现方案为:确定待处理文本图像包括的多个字段与多个预定字段名彼此之间的相似度;将多个字段中相似度大于相似度阈值的字段,确定为目标字段名;从多个字段中除目标字段名之外的M个剩余字段中,确定与目标字段名相对应的目标字段值,M≥1;以及输出目标字段名与目标字段值之间的对应关系。
-
公开(公告)号:CN110991456A
公开(公告)日:2020-04-10
申请号:CN201911236577.1
申请日:2019-12-05
申请人: 北京百度网讯科技有限公司
发明人: 沈俊宇 , 向宇波 , 刘建夏 , 王佳阳 , 苏崔聪 , 孙尧佳 , 袁运筹 , 王天天 , 林海涛 , 张文康 , 宋乐侃 , 张红光 , 王磊 , 牛宝龙 , 张文东 , 喻友平 , 吴甜
摘要: 本申请公开了一种票据识别方法及装置,涉及计算机视觉技术领域。具体实现方案为:预先从多个排版样式不同的票据中,提取出名称不同但含义相同的字段,将该些字段存储在第一集合中,需要票据识别时,利用该关键字段集合,自动将待识别的票据中的含义相似的字段提取出来作为关键字段,进而得到待识别票据的结构化信息,票据识别准确度高。
-
公开(公告)号:CN114419640B
公开(公告)日:2023-08-11
申请号:CN202210183469.8
申请日:2022-02-25
申请人: 北京百度网讯科技有限公司
IPC分类号: G06V30/412 , G06V30/19 , G06F40/242 , G06F40/289 , G06F40/30 , G06Q40/02
摘要: 本公开提供了一种文本处理方法、装置、电子设备及存储介质,涉及图像处理技术领域,尤其涉及计算机视觉领域。具体实现方案为:确定待处理文本图像包括的多个字段与多个预定字段名彼此之间的相似度;将多个字段中相似度大于相似度阈值的字段,确定为目标字段名;从多个字段中除目标字段名之外的M个剩余字段中,确定与目标字段名相对应的目标字段值,M≥1;以及输出目标字段名与目标字段值之间的对应关系。
-
公开(公告)号:CN110991456B
公开(公告)日:2023-07-07
申请号:CN201911236577.1
申请日:2019-12-05
申请人: 北京百度网讯科技有限公司
发明人: 沈俊宇 , 向宇波 , 刘建夏 , 王佳阳 , 苏崔聪 , 孙尧佳 , 袁运筹 , 王天天 , 林海涛 , 张文康 , 宋乐侃 , 张红光 , 王磊 , 牛宝龙 , 张文东 , 喻友平 , 吴甜
IPC分类号: G06V30/148 , G06F16/25 , G06F40/10
摘要: 本申请公开了一种票据识别方法及装置,涉及计算机视觉技术领域。具体实现方案为:预先从多个排版样式不同的票据中,提取出名称不同但含义相同的字段,将该些字段存储在第一集合中,需要票据识别时,利用该关键字段集合,自动将待识别的票据中的含义相似的字段提取出来作为关键字段,进而得到待识别票据的结构化信息,票据识别准确度高。
-
公开(公告)号:CN114821603A
公开(公告)日:2022-07-29
申请号:CN202210211125.3
申请日:2022-03-03
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种票据识别方法、装置、电子设备以及存储介质,涉及深度学习、模式识别领域,可以为:获取待识别的目标票据;分别对多个文本块在目标票据上的二维位置信息进行编码处理,得到多个编码结果;分别对多个编码结果进行图卷积处理,得到多个卷积结果;基于第一条件随机场模型对每个卷积结果进行识别,得到目标票据的文本块级别的第一预测结果,第一条件随机场模型与第二条件随机场模型之间协同训练,第二条件随机场模型用于对每个卷积结果进行识别,以得到目标票据的字级别的第二预测结果。避免了第二条件随机场模型引入的切分误差,在提升第二条件随机场模型的性能的同时,也促进了第一条件随机场模型的预测性能。
-
-
-
-
-
-