一种裁判文书结构化方法及装置

    公开(公告)号:CN111259645A

    公开(公告)日:2020-06-09

    申请号:CN202010041170.X

    申请日:2020-01-15

    摘要: 本申请提供了一种裁判文书结构化方法及装置,其中,首先利用第一抽取模板抽取待处理裁判文书中的块文本,得到第一结构化文本。然后,利用第二抽取模板从所述第一结构化文本的指定块文本中进行抽取,得到子结构化文本。最后,利用所述子结构化文本更新所述第一结构化文本中对应的内容,得到第二结构化文本。可见,本申请所提供的裁判文书结构化方法可以通过二次结构化的方式对隐含于待处理裁判文书中的信息进一步抽取,以使所得的第二结构化文本可以更完整地展示待处理裁判文书的内容。

    一种裁判文书结构化方法及装置

    公开(公告)号:CN111222312A

    公开(公告)日:2020-06-02

    申请号:CN202010041162.5

    申请日:2020-01-15

    摘要: 本申请提供了一种裁判文书结构化方法及装置,其中,文本处理器在接收到待处理裁判文书之后,按照目标抽取模板中每一抽取节点,确定待处理裁判文书中的节点字符,并确定每一所述抽取节点对应的块文本,从而完成对待处理裁判文书的文本的对应抽取工作。最后,将每一所述抽取节点与所述块文本相对应,生成所述待处理裁判文书的结构化文本,此时经过结构化之后的待处理裁判文书具有标准的格式,可以令用户通过浏览抽取节点确定所要查找的内容,并快速对应至相关的具体内容。

    股市运行风险评估方法、装置、电子设备及存储介质

    公开(公告)号:CN111105154A

    公开(公告)日:2020-05-05

    申请号:CN201911307372.8

    申请日:2019-12-17

    IPC分类号: G06Q10/06 G06Q40/04

    摘要: 本申请提供一种股市运行风险评估方法、装置、电子设备及存储介质。方法包括:获取预设时间段内的金融数据信息;根据所述金融数据信息对购买力风险、股市自身风险和政策风险中的至少一项进行分析,获得对应的购买力风险因子、股市自身风险因子和政策风险因子中的至少一项;根据所述购买力风险因子、股市自身风险因子和政策风险因子获得股市风险的评估结果。本申请实施例通过对金融数据信息进行分析,自动获得购买力风险、股市自身风险和政策风险中的至少一个,从而获得评估结果,不需要人工分析,提高了对股市风险评估的效率。

    一种从表格中抽取信息的方法及装置

    公开(公告)号:CN110188107B

    公开(公告)日:2020-05-01

    申请号:CN201910486551.6

    申请日:2019-06-05

    IPC分类号: G06F16/22 G06F16/953

    摘要: 本申请实施例提供了一种从表格中抽取信息的方法及装置,能够解析网页源代码,根据网页源代码中的表格标签提取网页中的表格代码;根据表格代码中的单元格跨行属性值和跨列属性值将合并单元格分解为多个单元格;获取表头单元格和对应的表头类别;根据表格中的非表头单元格相对于表头单元格的位置关系,确定非表头单元格的领属表头单元格;根据非表头单元格与领属表头单元格的对应关系,以及对应的表头类别的输出规则,抽取并输出表头单元格和非表头单元格中的内容。本申请实施例提供的技术方案不需要人工手动参与信息抽取,本领域技术人员只需要配置一次输出规则,就可以自动从大量的网页表格中抽取有价值的信息,因此提高了信息抽取效率。

    一种信息提取方法、装置及服务器

    公开(公告)号:CN111008523A

    公开(公告)日:2020-04-14

    申请号:CN201911149818.9

    申请日:2019-11-21

    发明人: 任宁

    摘要: 本申请实施例提供了一种信息抽取方法、装置及服务器。能够从房屋租赁合同等文本中匹配并抽取出包含合同标的物的金额相关信息的段落,然后从该段落进一步抽取到包含金额相关的信息的分句和分句中的字段,并对抽取到的分句和字段进行匹配分析,抽取出金额相关的信息;然后根据金额类型确定是否对抽取到的内容进行输出。由此,本申请实施例提供的技术方案,实现了对房屋租赁合同等文本的自动化分析和信息抽取,操作效率高,避免了人力资源和大量时间的消耗,提高信息录入的时效性。

    一种新类挖掘方法及装置

    公开(公告)号:CN107391674B

    公开(公告)日:2020-04-10

    申请号:CN201710601980.4

    申请日:2017-07-21

    IPC分类号: G06F16/35

    摘要: 本申请实公开了一种新类挖掘方法及装置。所述方法包括:在使用分类树对分类数据进行分类时,记录分类到每个目标标签对应的节点下的数据量;监测各目标标签对应节点下的数据量,当目标标签对应节点下的数据量达到预设量值时,对数据量达到预设量值的目标标签对应节点下的数据进行扫描提取,并进行聚类计算,生成新的子类标签。本申请实施例提供技术方案,对数据量过大的标签下的数据进行新类挖掘,也就是进行进一步细分,从而能够自动更新分类体系,提供更准确的数据分类,提高分类效率。

    合同相对方信息的结构化方法及装置

    公开(公告)号:CN110765188A

    公开(公告)日:2020-02-07

    申请号:CN201910838971.6

    申请日:2019-09-05

    IPC分类号: G06F16/25 G06F16/35 G06Q50/18

    摘要: 本申请公开了合同相对方信息的结构化方法及装置,首先从合同文本中抽取至少一个包括相对方信息的内容区块,由于内容区块中包括每个相对方主体的属性信息,不便于区分属性信息与相对方主体的所属关系,进而不便于审核,因此该方法再按照属性信息,将每一内容区块切分成若干目标行,使每一目标行与一条属性信息对应,进而以每一条属性信息为归类对象,方便对每个相对方主体的属性信息进行归类,即,从切分得到的若干目标行中,分别提取出每个相对方主体的属性信息。将该方法应用于合同的机器辅助审核方法中,使机器可以根据相对方信息的结构化处理结果来审核相对方信息,提高审核效率和审核的准确性。

    一种招聘信息标准化方法及装置
    9.
    发明公开

    公开(公告)号:CN110377907A

    公开(公告)日:2019-10-25

    申请号:CN201910651888.8

    申请日:2019-07-18

    IPC分类号: G06F17/27 G06Q10/10

    摘要: 本申请提供了一种招聘信息标准化方法及装置,其中,所述方法包括:按照第一类关键词和第二类关键词,确定招聘信息中的可结构化内容和非结构化内容;划分所述非结构化内容为单句;合并同内容单句,得到若干基础内容;从所述基础内容中确定优选内容;生成标准化招聘信息。本申请所提供的招聘信息标准化方法能够不仅能够提取出各类招聘信息中的可结构化内容,还能够提取出各类招聘信息中的非结构化内容,同时对非结构化内容进行分析,准确确定出对应于标准模板的基础内容和优选内容,令生成的标准招聘信息更加清晰、准确,大大便利了求职人员的工作。

    一种简历信息的结构化方法及装置

    公开(公告)号:CN110377560A

    公开(公告)日:2019-10-25

    申请号:CN201910650930.4

    申请日:2019-07-18

    IPC分类号: G06F16/11 G06F17/24

    摘要: 本申请提供了一种简历信息的结构化方法及装置,其中,所述方法包括:转化待结构化简历的文件格式为标准文件格式,得到处理后简历;解析所述处理后简历,获得所述处理后简历中的前置信息;结合所述前置信息与提取项目名称,确定处理后简历中的待提取内容;按照预设技术关键词词表,抽取所述待提取内容中对应的关键词;根据各关键词,生成结构化简历。本申请所提供的表格式简历的结构化方法及装置,能够有效解决现有简历结构化方法所提取的信息不准确的问题,通过本申请的方法所获的结构化简历能够更加便于招聘人员审阅以及简历信息管理平台的管理工作。