一种文档表格自动检测方法
    1.
    发明公开

    公开(公告)号:CN117894029A

    公开(公告)日:2024-04-16

    申请号:CN202311863158.7

    申请日:2023-12-29

    Abstract: 本发明公开了一种文档表格自动检测方法,首先根据输入文件类别调用PDF解析器或者OCR模块从文档页中抽取文本块及其属性;其次对文本块进行预处理,结合其位置信息获得特征向量;将文本块特征向量输入二维文本位置编码器,获得蕴含全局信息的文本表示向量;利用文本表示向量对文本块进行分类,输出对应的表格边界类别;通过启发式算法,对分类为表格内文本的文本块进行聚合,生成候选表格区域;最后利用表格边界类别,对候选表格区域进行进一步切分,输出最终表格区域边界。相对于现有技术,本发明能准确、稳定地检测出文档中表格所在位置。

    一种基于指令的文档图像处理方法及系统

    公开(公告)号:CN116580411A

    公开(公告)日:2023-08-11

    申请号:CN202310843671.3

    申请日:2023-07-11

    Abstract: 本发明公开了一种基于指令的文档图像处理方法及系统,所述方法包括:获取文档图像,并将所述文档图像输入至文档图像编码模型获得文档图像视觉特征;获取文档处理操作指令,并将所述文档处理操作指令输入至文档处理指令解析模型得到简单操作指令序列;将所述简单操作指令序列输入至文档处理指令编码模型,得到文档指令语义特征;将所述文档图像视觉特征和所述文档指令语义特征输入至文档多模态大模型,得到图像变换操作序列和模态输出内容;获取文档处理修订指令,基于所述文档处理修订指令完成所述文档图像处理。本发明通过深入理解文档格式和内容,有效与用户进行交互,通过解析用户指令,准确完成定制化文档操作,并根据用户反馈进行迭代修订。

    一种印章内容识别方法、系统及介质

    公开(公告)号:CN118334670A

    公开(公告)日:2024-07-12

    申请号:CN202311723322.4

    申请日:2024-06-11

    Abstract: 本发明公开了一种印章内容识别方法、系统及介质,该方法包括:获取带有印章的图片,对图片中的印章进行检测定位,得到印章在图像中的位置坐标和类别;根据印章的位置坐标裁剪出印章的图像区域,得到由多边形坐标列表表示的印章内容区域;对多边形坐标进行排序,对印章类别为圆形和椭圆形的印章内容区域,执行基于圆弧曲线的印章内容区域矫正算法,将圆形或椭圆形的印章内容区域矫正成矩形,得到矫正后的印章内容区域;对印章内容区域,执行印章内容识别算法,输出印章的文字内容。本发明能够有效解决印章内容识别问题,完成合同或发票等主体对象名称与印章内容的对比校验,能够节省大量的人工成本,提升企业的办公效率。

    一种基于指令的文档图像处理方法及系统

    公开(公告)号:CN116580411B

    公开(公告)日:2023-10-20

    申请号:CN202310843671.3

    申请日:2023-07-11

    Abstract: 本发明公开了一种基于指令的文档图像处理方法及系统,所述方法包括:获取文档图像,并将所述文档图像输入至文档图像编码模型获得文档图像视觉特征;获取文档处理操作指令,并将所述文档处理操作指令输入至文档处理指令解析模型得到简单操作指令序列;将所述简单操作指令序列输入至文档处理指令编码模型,得到文档指令语义特征;将所述文档图像视觉特征和所述文档指令语义特征输入至文档多模态大模型,得到图像变换操作序列和模态输出内容;获取文档处理修订指令,基于所述文档处理修订指令完成所述文档图像处理。本发明通过深入理解文档格式和内容,有效与用户进行交互,通过解析用户指令,准确完成定制化文档操作,并根据用户反馈进行迭代修订。

Patent Agency Ranking