一种结构化数据提取方法和系统
    3.
    发明公开

    公开(公告)号:CN117216015A

    公开(公告)日:2023-12-12

    申请号:CN202311214728.X

    申请日:2023-09-19

    摘要: 本发明涉及一种结构化数据提取方法和系统,包括:获取源文件;对源文件进行识别,确定源文件的类型;若源文件为非扫描版PDF文件,则采用按页处理的方式对非扫描版PDF文件进行数据提取,获得非扫描版PDF文件的结构化数据;若源文件为扫描版PDF文件,则采用光学字符识别技术的方式对扫描版PDF文件进行数据提取,获得扫描版PDF文件的结构化数据;若源文件为图纸版PDF文件,则采用区域定位和解析的方式对图纸版PDF文件进行数据提取,获得图纸版PDF文件的结构化数据。本发明可以根据不同类型的PDF文件采用对应的方式进行数据提取,有效解决了目前单一提取方法的准确度低、耗时耗力、人工成本高等问题,显著提高了数据利用率。

    主系统建模方法、装置、设备、存储介质和程序产品

    公开(公告)号:CN117634148A

    公开(公告)日:2024-03-01

    申请号:CN202311459431.X

    申请日:2023-11-02

    IPC分类号: G06F30/20 G06F119/14

    摘要: 本申请涉及一种主系统建模方法、装置、设备、存储介质和程序产品。所述方法包括:获取对核电厂主系统预先划分得到多个建模部分;对于每个建模部分,接收用户输入的待从上游抓取的参数名称;基于数据抓取程序,从上游抓取各个建模部分对应的参数名称所对应的建模参数;根据建模参数创建核电厂主系统的有支撑三回路模型。这样实现核电厂主系统力学分析中建模工作的自动化,大幅缩短建立模型和分析模型所需的时间,减少了人工干预,提高了建模效率。