合同信息提取方法、装置、计算机设备和存储介质

    公开(公告)号:CN109582772B

    公开(公告)日:2024-09-17

    申请号:CN201811425043.9

    申请日:2018-11-27

    摘要: 本申请涉及人工智能,提供一种合同信息提取方法、装置、计算机设备和存储介质,所述方法包括:获取待处理文本,待处理文本包括多个合同信息;对合同信息进行标注,得到对应的合同标注结果;根据合同标注结果确定合同信息对应的候选字段;对候选字段进行字段对齐,得到对齐字段;将对齐字段输入已训练的关联模型进行关联,得到关联记录信息;将关联记录信息输入已训练的概率统计模型,得到关联记录信息对应的概率统计结果;根据概率统计结果对关联记录信息进行筛选得到目标关联记录信息,根据目标关联记录信息获取合同提取信息,能够在多篇合同信息中完整的获取多条记录。

    资源数据的处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN110458601B

    公开(公告)日:2023-11-24

    申请号:CN201910612928.8

    申请日:2019-07-09

    IPC分类号: G06Q30/0201 G06Q10/067

    摘要: 本申请涉及一种资源数据的处理方法、装置、计算机设备和存储介质。所述方法包括:接收终端发送的查询请求;查询请求携带待预测区域的区域标识;获取与区域标识对应的资源数据预测指标,根据资源数据预测指标查询数据库,获取与资源数据预测指标对应的待预测数据;将待预测数据进行转化,得到与资源数据预测指标对应的关联值;将关联值进行转化,得到与资源数据预测指标对应的参考值;将参考值输入资源数据预测模型,得到与区域标识对应的资源数据预测值;根据资源数据预测值生成资源数据预测信息,将资源数据预测信息发送至终端进行显示。本方法基于预测模型对资源数据预测值进行全面跟踪评估,提高了生成的资源数据预测信息的准确性。

    知识图谱的关系对齐方法、装置、设备及存储介质

    公开(公告)号:CN111026865B

    公开(公告)日:2023-07-21

    申请号:CN201910992324.0

    申请日:2019-10-18

    IPC分类号: G06F16/35 G06F16/36

    摘要: 本发明涉及人工智能领域,公开了知识图谱的关系对齐方法、装置、设备及存储介质,通过关系进行向量化以及计算关系向量之间的相似度,判断关系是否相似并对关系进行分类,提高了知识图谱中关系对齐的效率。本发明方法包括:获取知识图谱中的三元组数据;通过预置的向量转换模型将三元组数据进行转换,得到每个关系的关系初始向量;通过预置的聚类算法对所有关系初始向量进行聚类,得到每个关系的关系聚类向量;通过预置的聚类算法对三元组数据中相同关系的初始关系向量进行聚类,得到每个关系的关系子向量;基于关系初始向量、关系聚类向量以及关系子向量,计算任意两个三元组中的关系之间的关系相似度;根据关系相似度对关系进行分类。

    知识图谱的关系对齐方法、装置、设备及存储介质

    公开(公告)号:CN111026865A

    公开(公告)日:2020-04-17

    申请号:CN201910992324.0

    申请日:2019-10-18

    IPC分类号: G06F16/35 G06F16/36

    摘要: 本发明涉及人工智能领域,公开了知识图谱的关系对齐方法、装置、设备及存储介质,通过关系进行向量化以及计算关系向量之间的相似度,判断关系是否相似并对关系进行分类,提高了知识图谱中关系对齐的效率。本发明方法包括:获取知识图谱中的三元组数据;通过预置的向量转换模型将三元组数据进行转换,得到每个关系的关系初始向量;通过预置的聚类算法对所有关系初始向量进行聚类,得到每个关系的关系聚类向量;通过预置的聚类算法对三元组数据中相同关系的初始关系向量进行聚类,得到每个关系的关系子向量;基于关系初始向量、关系聚类向量以及关系子向量,计算任意两个三元组中的关系之间的关系相似度;根据关系相似度对关系进行分类。

    基于神经网络混合模型的法律条文检索方法及相关设备

    公开(公告)号:CN110928987A

    公开(公告)日:2020-03-27

    申请号:CN201910991657.1

    申请日:2019-10-18

    IPC分类号: G06F16/33 G06F40/126 G06N3/04

    摘要: 本申请涉及人工智能领域,本申请公开了一种基于神经网络混合模型的法律条文检索方法及相关设备,所述方法包括:获取输入文本,对所述输入文本进行向量化,获得第一文本向量及第二文本向量;对所述第一文本向量及所述第二文本向量进行堆栈嵌入,获得第一循环向量及第二循环向量;将所述第一循环向量与所述第二循环向量进行拼接,获得混合向量,并对所述混合向量进行堆栈嵌入,获得混合堆栈向量;对所述混合堆栈向量进行归一化处理,获得文本检索结果。本申请通过对输入文本进行多路输入,并对多路输入向量化,进行堆栈嵌入循环运算,对运算后的结果拼接后再次进行堆栈嵌入循环运算,获得法律条文的检索结果,可以有效提高法律条文检索的准确度。

    企业风险分析方法、装置、计算机设备和存储介质

    公开(公告)号:CN109657932A

    公开(公告)日:2019-04-19

    申请号:CN201811445114.1

    申请日:2018-11-29

    IPC分类号: G06Q10/06

    摘要: 本申请涉及一种企业风险分析方法、装置、计算机设备和存储介质,获取待分析企业的发票信息,获取到发票信息中的时间信息、发票代码信息、关联企业信息、税目信息及交易数据,根据时间信息、发票代码信息、关联企业信息、税目信息及交易数据进行处理后,获得多个企业特征,用于作为待分析企业的企业特征,使得企业特征更贴近企业的实际运营情况,将各企业特征输入通过发票信息建立的风控模型进行风险评估,确定初步企业风险概率及企业异常特征,评估出的评估结果也更贴近于企业的风险程度,准确性更高,基于所述企业异常特征对初步企业风险概率进行修正,获得企业风险概率,进一步提高评估的准确度。

    风险预警方法、装置、计算机设备和存储介质

    公开(公告)号:CN109409659A

    公开(公告)日:2019-03-01

    申请号:CN201811089191.8

    申请日:2018-09-18

    发明人: 于修铭 汪伟 肖京

    IPC分类号: G06Q10/06 G06F16/2457

    CPC分类号: G06Q10/0635

    摘要: 本申请涉及一种基于信息安全的风险预警方法、装置、计算机设备和存储介质。所述方法包括:服务器接收并根据预警请求,获取对应的初始数据,将根据相邻的数据获取周期获取的初始数据进行比对,获得增量数据。利用预设的风险判定规则对增量数据进行风险识别,获取符合风险判定规则的可用增量数据,根据符合风险判定规则的可用增量数据生成风险数据。获取风险数据对应的风险类别,并根据预设的风险类别和预警信号之间的对应关系,获取与风险类别对应的预警信号,将与风险类别对应的预警信号发送至终端。采用本方法针对增量数据获得风险数据,避免对所有初始数据进行处理,可有效减少数据处理操作,且针对性地向终端发送预警信号,提高了工作效率。

    不平衡样本数据预处理方法、装置和计算机设备

    公开(公告)号:CN109325118A

    公开(公告)日:2019-02-12

    申请号:CN201811018913.0

    申请日:2018-09-03

    发明人: 于修铭 汪伟 肖京

    IPC分类号: G06F16/35

    摘要: 本申请涉及一种基于数据资源的不平衡样本数据预处理方法、装置、计算机设备和存储介质。所述方法包括:接收并根据数据获取请求获取初始数据,根据预设的分类规则对初始数据进行分类,获得第一类样本集和第二类样本集。对抽取的K个第一样本点进行特征分析,获得第一类样本集的新增数据特征。根据第一类样本集对应的第一类标签,生成第一类样本集的新增数据标签。计算第一类样本集的数量和第二类样本集的数量之间的比例。根据新增数据特征和新增数据标签生成第一类样本集的新增数据,按照比例调整新增数据的数量,以增加第一类样本集的数量。采用本方法能够使得第一类样本集和第二类样本集的数量处于平衡状态,解决了样本不平衡的问题。

    基于知识图谱的案件检索方法、装置、设备及存储介质

    公开(公告)号:CN111241241B

    公开(公告)日:2024-05-31

    申请号:CN202010017590.4

    申请日:2020-01-08

    摘要: 本申请涉及大数据领域,公开了一种基于知识图谱的案件检索方法、装置、设备及存储介质,提高了案件检索系统的可用性。本申请方法包括:根据文本信息构建法律案件知识图谱,将根据所述法律案件知识图谱构建的节点集合数据进行随机游走采样,获取多个序列数据,基于多个所述序列数据通过词转化向量算法对所述模型进行训练,获取更新的目标模型,获取目标文本信息,并通过所述目标模型分析所述目标文本信息以构建待检索知识图谱,根据所述待检索知识图谱在所述法律案件知识图谱中检索,以获取与所述待检索知识图谱关联的案件信息,根据所述案件信息的第一相似度和第二相似度,获取输出的案件信息。

    文本分类方法、装置及计算机可读存储介质

    公开(公告)号:CN110851596B

    公开(公告)日:2023-06-27

    申请号:CN201910967010.5

    申请日:2019-10-11

    摘要: 本发明涉及人工智能技术,揭露了一种文本分类方法,包括:对原始文本数据进行预处理得到文本向量;对所述文本向量进行标签匹配,得到带有标签的文本向量和不带有标签的文本向量;将所述带有标签的文本向量输入BERT模型获得词向量特征;根据所述词向量特征,利用卷积神经网络模型对所述不带有标签的文本向量进行训练,得到带有虚拟标签的文本向量;利用随机森林模型对所述带有标签的文本向量和带有虚拟标签的文本向量进行多标签的分类,得到文本分类结果。本发明还提出一种文本分类装置以及一种计算机可读存储介质。本发明可以实现精准高效的文本分类功能。