一种基于融合检测的底稿图像识别系统及方法

    公开(公告)号:CN118736610A

    公开(公告)日:2024-10-01

    申请号:CN202411131738.1

    申请日:2024-08-19

    摘要: 本发明公开了一种基于融合检测的底稿图像识别系统及方法,属于光学字符识别技术领域,其方法具体包括:获取底稿图像,并对获取的底稿图像进行预处理,对预处理后的底稿图像进行角度识别,并进行旋转校正处理,对旋转校正后的底稿图像中的文本位置进行识别,根本识别出的底稿图像中的文本位置,对底稿图像中文本内容进行识别,通过融合多种检测方法,可以综合各自的优点,减少单一方法的缺陷,提高底稿图像的识别精度,该方法适用于各种复杂的底稿图像识别场景,包括但不限于金融领域的底稿图像等。

    基于信创环境的财务票据报销会计档案系统及方法

    公开(公告)号:CN118297737A

    公开(公告)日:2024-07-05

    申请号:CN202410486445.9

    申请日:2024-04-22

    摘要: 本发明公开了一种基于信创环境的财务票据报销会计档案系统及方法,包括:采集历史财务票据报销会计档案进行数据预处理,形成样本数据集;基于自然语言处理算法和深度学习算法构建识别模型,对所述样本数据集进行识别,得到文字信息和票据图像;将所述文字信息、所述票据图像以表格形式存储于应用区块链技术的档案管理系统内,以保证数据的不可篡改性;结合数据分析方法,对存储的所述文字信息、所述票据图像进行分析,输出分析结果。本发明通过综合利用自然语言处理技术、深度学习算法和区块链技术,提高了财务票据管理的准确性、效率和安全性。

    一种基于语料字典的行内公式识别方法及装置

    公开(公告)号:CN118155223A

    公开(公告)日:2024-06-07

    申请号:CN202410188057.2

    申请日:2024-02-20

    IPC分类号: G06V30/30 G06V30/42 G06V30/18

    摘要: 本发明公开了一种基于语料字典的行内公式识别方法及装置,本发明先利用自研发的启发式识别算法识别出待识别文本中的等号,以等号所在位置为中线向其左右两侧逐字符搜索公式特征字符,再以等号两侧搜索到的第一个公式特征字符为搜索起点继续向两侧进行搜索直至遇到非公式特征字符并根据左右两个非公式特征字符的字符信息快速、准确、高效地定位出公式位置,整个过程无需进行深度学习训练,简单高效,适用于多种文档类型,且在各类文档样本均具有优秀的鲁棒性和准确率,可以满足日益增长的公式处理需求。

    一种基于神经网络的发票识别方法和系统

    公开(公告)号:CN112464941B

    公开(公告)日:2024-05-24

    申请号:CN202011148662.5

    申请日:2020-10-23

    发明人: 漆孟冬

    摘要: 本发明公开了一种基于神经网络的发票识别方法和系统,涉及计算机技术领域,所述方法通过按发票内容将发票进行分切,通过第一神经网络模型识别分切图中的文字框,基于文字框的位置区域将分切图进一步分切,获得文字框图,以删除多余空白区域,一方面减少计算量,提高识别效率,另一方面同时删除了发票上的格线,避免了格线对文字识别的干扰,提高文字定位的准确率;基于第二神经网络模型识别文字框图的文字;将所识别的文字基于文字框图的位置区域拼接,获得分切图的文字内容,从而获得发票的识别结果。

    信息校验方法、装置、终端设备以及存储介质

    公开(公告)号:CN117994799A

    公开(公告)日:2024-05-07

    申请号:CN202410044255.1

    申请日:2024-01-11

    发明人: 刘新 赵涛

    摘要: 本发明公开了一种信息校验方法、装置、终端设备以及存储介质,所述方法包括:响应于EOL下线检测指令,从当前待检测电子控制单元ECU模块中读取出第一ECU信息;根据所述第一ECU信息调用制造执行MES系统的预设接口,得到目标ECU图像文件;通过图像识别技术识别所述目标ECU图像文件,得到第二ECU信息;对比所述第一ECU信息与所述第二ECU信息,得到信息校验结果。本发明实施例通过对从ECU直接读取的第一ECU信息和通过调用MES系统接口根据图像识别技术得到的第二ECU信息,得到信息校验结果,从而验证ECU信息是否有信息录入出错或者被篡改的情况,从而保证ECU信息的一致性。

    一种智能判题方法与系统
    7.
    发明公开

    公开(公告)号:CN116798038A

    公开(公告)日:2023-09-22

    申请号:CN202310235417.5

    申请日:2023-03-13

    摘要: 本发明公开了一种智能判题方法与系统,该方法包括题型判断,根据学生作答图片进行ocr识别的latex公式,并获取正确答案的latex公式,以正则匹配的方式确定题型;根据得到的题型,学生作答信息和正确答案,判断答案是否正确;将得到的对比结果,以及学生作答的latex公式返回。本发明获取学生作答的latex公式,首先使用sympy库进行转换得到sympy可处理格式;其次通过对正确答案以正则匹配的方式确定题型,不同题型的判题方式不同;最后对学生作答信息使用答案对比模块进行处理得到学生作答情况及得分,能够对更多的公式类型进行识别,满足更多场景的使用。

    一种基于自监督学习任务的手绘草图理解深度学习方法

    公开(公告)号:CN113673635B

    公开(公告)日:2023-09-01

    申请号:CN202010411459.6

    申请日:2020-05-15

    申请人: 复旦大学

    摘要: 本发明提供了一种基于自监督学习任务的手绘草图理解深度学习方法,其特征在于,包括如下步骤:步骤S1,基于不同的手绘草图中点的数据的分类对其中部分数据进行抹除,进一步将抹除部分数据后的手绘草图的数据用于自监督学习;步骤S2,将手绘草图的数据序列化后嵌入编码;步骤S3,将基于双向编码表示和自注意力机制的深度学习网络作为深度特征提取模块,并利用该深度特征提取模块提取手绘草图对应的点数据的深度特征;步骤S4,利用提取的深度特征预测被抹除的部分数据的坐标数据和状态数据;步骤S5,使用损失函数分别对坐标数据的预测与状态数据的预测任务进行训练从而获得训练好的网络模型。

    一种数学公式识别方法、装置
    9.
    发明公开

    公开(公告)号:CN116469117A

    公开(公告)日:2023-07-21

    申请号:CN202310509754.9

    申请日:2023-05-08

    发明人: 谢卫军 李博 刘瑾

    摘要: 本发明提供一种数学公式识别方法、装置,涉及识别技术领域。该数学公式识别方法,具体包括以下步骤:S1.公式编存,将已知公式进行汇总,并构建公式组合模型进行存储定义;S2.获取图像信息,接收待识别文本图像,包括外接载入和实时获取。通过在识别过程中充分利用了数学公式的结构性质,降低了字符识别的难度,优化了整个识别过程的效果和流程,提升了对文本图像数学公式识别的精确性和识别速度,为用户提供更加精准、简便、快捷的数学公式输入体验,同时利用提取的文本图像特征描述了当前字符前后括号的匹配情况,从而可以有效地避免字符的歧义及前后括号不匹配的情况,且识别过程考虑了字符间的时序性,提升了歧义字符的识别准确度。

    一种证照信息提取的方法、装置及存储介质

    公开(公告)号:CN114443834A

    公开(公告)日:2022-05-06

    申请号:CN202111580886.8

    申请日:2021-12-22

    摘要: 本公开涉及文本结构化技术领域,公开了一种证照信息提取的方法、装置及存储介质,该方法应用于智能终端,包括:对证照的图像进行文本检测,得到至少一个文本框,并对文本框进行OCR识别,得到至少一个文字段,将每一个文字段转换成特征向量,对特征向量进行分类,确定文字段对应的类别标签,从而量化了文字段的分类,以及,基于预设的文本书写顺序,将属于同一个类别标签的各个文字段进行合并,得到类别内容,这样得到的类别内容更全面,基于预设的类别标签与类别内容之间的映射关系,分别将各个类别标签和各个类别内容进行匹配,得到与每一个类别标签对应的类别内容,通过上述分类和内容提取,提升了证照图像上的文本信息结构化的准确性。