-
公开(公告)号:CN116910257A
公开(公告)日:2023-10-20
申请号:CN202310910731.9
申请日:2023-07-24
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
摘要: 本申请涉及语义处理技术领域,尤其涉及一种报文类别识别方法、装置、产品、介质和设备。其中方法包括:通过语义识别模型识别报文的报文类别;根据报文类别确定报文中关键字段的位置信息;基于关键字段的位置信息从报文中提取关键字段的内容;根据关键字段的内容与报文类别的匹配情况,确定报文类别是否识别正确;若不正确,则将报文对应的报文信息导入样本库中;从样本库中获取增量样本集;增量样本集用于修正语义识别模型,从而进行后续报文的报文类别识别。通过上述方式,可以生成一个增量样本集,执行增量训练,修正之后的语义识别模型意见包含了新报文类别识别功能,因此,才能实现对后续报文的准确识别,进而提高报文结算的效率。
-
公开(公告)号:CN116884016A
公开(公告)日:2023-10-13
申请号:CN202310917435.1
申请日:2023-07-25
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
IPC分类号: G06V30/19
摘要: 本发明涉及图像识别领域,尤其涉及一种箱单影像识别方法、装置及介质,该方法包括:从箱单影像中识别出多个影像切片;针对每个影像切片,确定影像切片的各参考切片;参考切片在箱单影像中与影像切片满足相邻位置关系;根据各参考切片中的文本信息、影像切片中的文本信息及各参考切片与影像切片的位置关系,确定影像切片的实体标签;实体标签用于表征文本信息所属的语义对象;根据各影像切片的实体标签,获得箱单影像的识别结果。通过该方法可以解决现有的箱单影像识别方法未考虑到箱单影像中各类实体之间的关系,有概率审核识别出现错误的问题。
-
公开(公告)号:CN115906851A
公开(公告)日:2023-04-04
申请号:CN202211509137.0
申请日:2022-11-29
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
IPC分类号: G06F40/295 , G06F16/31 , G06F16/33
摘要: 本申请公开一种实体识别方法、装置、电子设备及存储介质,属于金融数据处理技术领域,该方法包括:对待识别条款的文本内容进行分词,得到分词序列,从各预设实体中分词的倒排索引表中,查询分词序列中每个分词的索引集合,基于各分词的索引集合确定候选实体,将与候选实体匹配的预设实体作为待识别条款的实体识别结果,其中,各预设实体是基于历史条款的文本内容包含的指定类型的实体确定的。这样,先对历史条款包含的指定类型的实体进行整理得到多个预设实体,并建立这些预设实体中分词的倒排索引表,后续,借助于倒排索引表从这些预设实体中确定待识别条款中指定类型实体的识别结果,即便实体长度较长,也可保证识别准确度。
-
公开(公告)号:CN117235574A
公开(公告)日:2023-12-15
申请号:CN202311194910.3
申请日:2023-09-15
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
IPC分类号: G06F18/24 , G06F16/29 , G06F16/35 , G06N3/0464 , G06N3/0442 , G06N3/08 , G06F40/289 , G06F40/284 , G06Q10/083
摘要: 本申请涉及文本分类技术领域,具体涉及一种寄单地址的识别方法、装置、设备及介质,用于解决现有技术中难以识别完整寄单地址的问题。该方法包括:获取信用证中的待检测文本;对所述待检测文本分别进行地址的起点识别和终点识别,并根据识别的起点和终点确定所述待检测文本包括的至少一个地址;针对所述至少一个地址中的每个地址,从所述待检测文本中获取所述每个地址之前的前缀词,并对所述每个地址对应的前缀词进行识别,所述前缀词包括至少一个词汇;当所述至少一个地址分别对应的前缀词中,第一前缀词的识别结果为寄单要求时,确定所述第一前缀词对应的地址为寄单地址。
-
公开(公告)号:CN115860686A
公开(公告)日:2023-03-28
申请号:CN202211668993.0
申请日:2022-12-23
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
摘要: 本申请涉及数据处理技术领域,尤其涉及一种数据录入方法、装置、设备及介质。在接收到数据录入的指令时,对待录入信用证的图像中的内容进行识别,获取图像中包含的文本信息,并基于预先训练完成的实体提取模型对文本信息进行处理,从而得到文本信息中包括的每个识别要素对应的内容,实现了准确、快捷的将信用证中的数据信息录入到电子设备中,提高了工作效率及准确率。
-
公开(公告)号:CN115221308A
公开(公告)日:2022-10-21
申请号:CN202210763807.5
申请日:2022-06-29
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
IPC分类号: G06F16/335 , G06F16/35 , G06F16/55 , G06F16/583 , G06F40/194 , G06N3/04 , G06N3/08 , G06N5/00 , G06N20/00
摘要: 本申请实施例提供一种图像分类方法、装置、电子设备及存储介质,涉及图像数据处理技术领域,通过预设的解析规则,对获取到的各个业务图像各自的业务文本进行解析过滤后,基于预设的业务分类模型,对待分类的各个第一文本进行基于第一文本类型的文本分类,进一步的,基于获得的分类结果,从获得的各个第一文本中,选择指定的各个第二文本进行基于第二文本类型的文本分类,基于上述方式,本申请实施例构建了适用于图像分类的多个业务层级,从而在每个分类层级中,采用相应的业务分类模型及识别规则,实现相应文本类型下的层级分类目标,进而在减少模型的训练资源需求的同时,有效提升了图像分类结果的准确性。
-
公开(公告)号:CN115827869A
公开(公告)日:2023-03-21
申请号:CN202211663202.5
申请日:2022-12-23
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
IPC分类号: G06F16/35 , G06F40/289 , G06F40/216
摘要: 本申请公开一种单据图像的处理方法、装置、电子设备及存储介质,属于图像处理技术领域,该方法包括:利用预先训练的至少两个分类模型,分别对获取的信用证交单业务中的单据图像进行单据类别识别,基于这至少两个分类模型的识别结果,确定单据图像的单据类别,若单据类别是信用证报文,则利用多条正则语句对单据图像中的文本内容进行匹配,其中,多条正则语句是根据每类信用证报文在每页报文上的关键语句预先确定的,进而基于匹配成功的正则语句对应的报文类别和报文页码,确定单据图像的处理结果。这样,可自动识别出属于信用证报文的单据图像,且可识别出单据图像是哪类信用证报文是这类信用证报文的哪页,单据图像的处理效率更高。
-
公开(公告)号:CN111144409A
公开(公告)日:2020-05-12
申请号:CN201911360519.X
申请日:2019-12-25
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
发明人: 卢时云 , 雷鸣 , 李力 , 王国悦 , 李瑾 , 陆佳庆 , 饶帆 , 任贺 , 孙春银 , 梁佳敏 , 潘玉婷 , 黄珊丽 , 袁娟 , 刘爱辉 , 韦有华 , 张玉敏 , 万光明 , 韦浩昕 , 王启杰 , 张剑涛 , 马超龙 , 欧佶 , 汪宏 , 石莹滢 , 张小彪 , 喻凯
IPC分类号: G06K9/32 , G06K9/72 , G06F40/295 , G06F16/36 , G06Q40/02
摘要: 本发明提供了一种跟单托收审单处理方法及系统,所述方法包括:对跟单托收文件的图像文件进行文字识别,若识别成功,则向业务人员展示识别得到的票据信息,若识别失败,向业务人员反馈识别失败信息以使业务人员通过人工识别方式得到票据信息,接收业务人员输入的票据信息;对所述票据信息进行审核得到审核结果并向业务人员展示,根据业务人员的控制指令确定是否采用所述审核结果,若否,转为手动模式以使业务人员人工审核得到审核结果,接收业务人员输入的审核结果;根据所述审核结果形成收款文件,本发明可提高跟单托收审单处理的效率,降低跟单托收审单的成本。
-
公开(公告)号:CN118689438A
公开(公告)日:2024-09-24
申请号:CN202410767546.3
申请日:2024-06-14
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
摘要: 本申请涉及数据处理技术领域,尤其涉及一种数据显示方法、装置、设备及介质。由于在本申请实施例中,确定被选中的待查看不符点的关键词在待审核报文中的第一位置信息,确定保存的待审核报文对应的报文表格中每个单元格记录的子报文在待审核报文中的第二位置信息,根据第一位置信息和每个第二位置信息,确定关键词所归属的目标子报文的目标位置信息,即使待审核报文中没有坐标信息,也可以根据待查看不符点的关键词所在的目标子报文的目标位置信息,将目标子报文滚动至屏幕的预设位置,方便了业务人员查看待审核报文中的不符点的相关信息,从而提高了报文审核的效率。
-
公开(公告)号:CN117274969A
公开(公告)日:2023-12-22
申请号:CN202311349414.0
申请日:2023-10-18
申请人: 中国建设银行股份有限公司 , 建信金融科技有限责任公司
摘要: 本申请涉及计算机视觉技术领域,尤其涉及一种印章识别方法、装置、设备及介质。在本申请实施例中,获取待识别票据的票据图像中,印章所在区域的第一印章图像,并将该第一印章图像输入到预先训练完成的识别模型中,由识别模型中的第一子模型对第一印章图像进行特征提取,得到第一印章图像对应的第一特征矩阵,识别模型中的第二子模型再对该第一特征矩阵进行处理,得到第一印章图像中的印章包括的目标文字,也就是说,本申请实施例中在得到票据图像中印章所在区域的第一印章图像之后,直接基于识别模型对第一印章图像中的印章进行识别,得到印章中包括的目标文字,实现了自动化识别印章文字,无需人工参与,提高了工作效率。
-
-
-
-
-
-
-
-
-