一种报文类别识别方法、装置、产品、介质和设备

    公开(公告)号:CN116910257A

    公开(公告)日:2023-10-20

    申请号:CN202310910731.9

    申请日:2023-07-24

    IPC分类号: G06F16/35 G06F40/30 G06Q40/02

    摘要: 本申请涉及语义处理技术领域,尤其涉及一种报文类别识别方法、装置、产品、介质和设备。其中方法包括:通过语义识别模型识别报文的报文类别;根据报文类别确定报文中关键字段的位置信息;基于关键字段的位置信息从报文中提取关键字段的内容;根据关键字段的内容与报文类别的匹配情况,确定报文类别是否识别正确;若不正确,则将报文对应的报文信息导入样本库中;从样本库中获取增量样本集;增量样本集用于修正语义识别模型,从而进行后续报文的报文类别识别。通过上述方式,可以生成一个增量样本集,执行增量训练,修正之后的语义识别模型意见包含了新报文类别识别功能,因此,才能实现对后续报文的准确识别,进而提高报文结算的效率。

    一种箱单影像识别方法、装置及介质

    公开(公告)号:CN116884016A

    公开(公告)日:2023-10-13

    申请号:CN202310917435.1

    申请日:2023-07-25

    IPC分类号: G06V30/19

    摘要: 本发明涉及图像识别领域,尤其涉及一种箱单影像识别方法、装置及介质,该方法包括:从箱单影像中识别出多个影像切片;针对每个影像切片,确定影像切片的各参考切片;参考切片在箱单影像中与影像切片满足相邻位置关系;根据各参考切片中的文本信息、影像切片中的文本信息及各参考切片与影像切片的位置关系,确定影像切片的实体标签;实体标签用于表征文本信息所属的语义对象;根据各影像切片的实体标签,获得箱单影像的识别结果。通过该方法可以解决现有的箱单影像识别方法未考虑到箱单影像中各类实体之间的关系,有概率审核识别出现错误的问题。

    一种实体识别方法、装置、电子设备及存储介质

    公开(公告)号:CN115906851A

    公开(公告)日:2023-04-04

    申请号:CN202211509137.0

    申请日:2022-11-29

    摘要: 本申请公开一种实体识别方法、装置、电子设备及存储介质,属于金融数据处理技术领域,该方法包括:对待识别条款的文本内容进行分词,得到分词序列,从各预设实体中分词的倒排索引表中,查询分词序列中每个分词的索引集合,基于各分词的索引集合确定候选实体,将与候选实体匹配的预设实体作为待识别条款的实体识别结果,其中,各预设实体是基于历史条款的文本内容包含的指定类型的实体确定的。这样,先对历史条款包含的指定类型的实体进行整理得到多个预设实体,并建立这些预设实体中分词的倒排索引表,后续,借助于倒排索引表从这些预设实体中确定待识别条款中指定类型实体的识别结果,即便实体长度较长,也可保证识别准确度。

    一种单据图像的处理方法、装置、电子设备及存储介质

    公开(公告)号:CN115827869A

    公开(公告)日:2023-03-21

    申请号:CN202211663202.5

    申请日:2022-12-23

    摘要: 本申请公开一种单据图像的处理方法、装置、电子设备及存储介质,属于图像处理技术领域,该方法包括:利用预先训练的至少两个分类模型,分别对获取的信用证交单业务中的单据图像进行单据类别识别,基于这至少两个分类模型的识别结果,确定单据图像的单据类别,若单据类别是信用证报文,则利用多条正则语句对单据图像中的文本内容进行匹配,其中,多条正则语句是根据每类信用证报文在每页报文上的关键语句预先确定的,进而基于匹配成功的正则语句对应的报文类别和报文页码,确定单据图像的处理结果。这样,可自动识别出属于信用证报文的单据图像,且可识别出单据图像是哪类信用证报文是这类信用证报文的哪页,单据图像的处理效率更高。

    一种数据显示方法、装置、设备及介质

    公开(公告)号:CN118689438A

    公开(公告)日:2024-09-24

    申请号:CN202410767546.3

    申请日:2024-06-14

    发明人: 周忻旸 陆佳庆

    IPC分类号: G06F3/147 G06F16/34

    摘要: 本申请涉及数据处理技术领域,尤其涉及一种数据显示方法、装置、设备及介质。由于在本申请实施例中,确定被选中的待查看不符点的关键词在待审核报文中的第一位置信息,确定保存的待审核报文对应的报文表格中每个单元格记录的子报文在待审核报文中的第二位置信息,根据第一位置信息和每个第二位置信息,确定关键词所归属的目标子报文的目标位置信息,即使待审核报文中没有坐标信息,也可以根据待查看不符点的关键词所在的目标子报文的目标位置信息,将目标子报文滚动至屏幕的预设位置,方便了业务人员查看待审核报文中的不符点的相关信息,从而提高了报文审核的效率。

    一种印章识别方法、装置、设备及介质

    公开(公告)号:CN117274969A

    公开(公告)日:2023-12-22

    申请号:CN202311349414.0

    申请日:2023-10-18

    IPC分类号: G06V20/62 G06V30/18 G06V30/19

    摘要: 本申请涉及计算机视觉技术领域,尤其涉及一种印章识别方法、装置、设备及介质。在本申请实施例中,获取待识别票据的票据图像中,印章所在区域的第一印章图像,并将该第一印章图像输入到预先训练完成的识别模型中,由识别模型中的第一子模型对第一印章图像进行特征提取,得到第一印章图像对应的第一特征矩阵,识别模型中的第二子模型再对该第一特征矩阵进行处理,得到第一印章图像中的印章包括的目标文字,也就是说,本申请实施例中在得到票据图像中印章所在区域的第一印章图像之后,直接基于识别模型对第一印章图像中的印章进行识别,得到印章中包括的目标文字,实现了自动化识别印章文字,无需人工参与,提高了工作效率。