PDF报表数据提取方法及装置

    公开(公告)号:CN109582928B

    公开(公告)日:2023-07-21

    申请号:CN201811488861.3

    申请日:2018-12-06

    发明人: 许德峰

    摘要: 本申请提供了一种PDF报表数据提取方法及装置,所述方法包括:根据一PDF文档格式的报表模板创建与该报表模板对应的XML格式模板,其中,XML格式模板包括报表的表头、各个数据项名称,及表头和各个数据项坐标,报表模板中数据项无对应数据。根据XML格式模板中各个数据项坐标,从与所述报表模板相同且存在数据项有数据的目标PDF文档中提取数据项对应的数据;根据XML格式模板的表头和提取的数据项对应的数据形成XML格式的报表。通过XML格式模板提取PDF文档格式的报表数据,便于对报表数据进行统计,极大的提高了报表的可识别性和灵活性。

    获取PDF注释信息的方法及装置
    2.
    发明公开

    公开(公告)号:CN109597970A

    公开(公告)日:2019-04-09

    申请号:CN201811486563.0

    申请日:2018-12-06

    发明人: 许德峰

    IPC分类号: G06F17/21 G06F17/22 G06F17/24

    摘要: 本申请提供了一种获取PDF注释信息的方法及装置,所述方法可从FDF文档中获取注释信息,通过解析FDF文档可直接获取到存储在FDF文档中存储有PDF文档的注释信息。其中,所述FDF文档数据格式是类似于PDF文档结构的数据格式类型,FDF文档格式完全兼容PDF文档格式定义的所有数据类型,且是大多数PDF阅读产品能够兼容的数据格式。在不同的PDF文档之间进行数据传递时,由于注释信息存储在与PDF文档数据结构类似的FDF文档中,使得注释信息提取更加方便且可避免产生数据失真的问题。

    PDF文档编辑的字体优化方法、装置、终端设备和存储介质

    公开(公告)号:CN107943760B

    公开(公告)日:2021-09-21

    申请号:CN201711175935.3

    申请日:2017-11-22

    发明人: 许德峰

    IPC分类号: G06F40/109 G06F16/335

    摘要: 本发明涉及文档编辑技术领域,提出一种PDF文档编辑的字体优化方法、装置、终端设备和计算机存储介质。采用本发明提出的字体优化方法,即使本地字体库中不存在与PDF文档内嵌字体数据中的family字体族名称和style字体样式名称均相同的字体,仍然能够通过名称匹配率的计算找出本地字体库中与PDF文档的内嵌字体最近似的目标本地字体,然后通过将当前的文本编辑字体调整为所述目标本地字体,以及根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理,使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果,进而解决了PDF文档编辑时新编辑文本与原有文本的显示效果不一致的问题,提高了用户体验。

    PDF报表数据提取方法及装置
    4.
    发明公开

    公开(公告)号:CN109582928A

    公开(公告)日:2019-04-05

    申请号:CN201811488861.3

    申请日:2018-12-06

    发明人: 许德峰

    IPC分类号: G06F17/21 G06F17/22 G06F17/24

    摘要: 本申请提供了一种PDF报表数据提取方法及装置,所述方法包括:根据一PDF文档格式的报表模板创建与该报表模板对应的XML格式模板,其中,XML格式模板包括报表的表头、各个数据项名称,及表头和各个数据项坐标,报表模板中数据项无对应数据。根据XML格式模板中各个数据项坐标,从与所述报表模板相同且存在数据项有数据的目标PDF文档中提取数据项对应的数据;根据XML格式模板的表头和提取的数据项对应的数据形成XML格式的报表。通过XML格式模板提取PDF文档格式的报表数据,便于对报表数据进行统计,极大的提高了报表的可识别性和灵活性。

    PDF文档编辑的字体优化方法、装置、终端设备和存储介质

    公开(公告)号:CN107943760A

    公开(公告)日:2018-04-20

    申请号:CN201711175935.3

    申请日:2017-11-22

    发明人: 许德峰

    IPC分类号: G06F17/21 G06F17/30

    CPC分类号: G06F17/214 G06F17/30699

    摘要: 本发明涉及文档编辑技术领域,提出一种PDF文档编辑的字体优化方法、装置、终端设备和计算机存储介质。采用本发明提出的字体优化方法,即使本地字体库中不存在与PDF文档内嵌字体数据中的family字体族名称和style字体样式名称均相同的字体,仍然能够通过名称匹配率的计算找出本地字体库中与PDF文档的内嵌字体最近似的目标本地字体,然后通过将当前的文本编辑字体调整为所述目标本地字体,以及根据所述内嵌字体信息中的style字体样式对当前编辑的文本进行文本修饰处理,使得所述当前编辑的文本具有与所述内嵌字体信息中的style字体样式对应的文本显示效果,进而解决了PDF文档编辑时新编辑文本与原有文本的显示效果不一致的问题,提高了用户体验。