信息抽取模型训练方法、装置、计算机设备和存储介质

    公开(公告)号:CN111444723A

    公开(公告)日:2020-07-24

    申请号:CN202010149572.1

    申请日:2020-03-06

    摘要: 本申请涉及一种信息抽取模型训练方法、装置、计算机设备和存储介质。所述方法包括:确定样本文本中所包含的实体;根据所述样本文本中所包含的各实体的出现频次以及词性,对所述样本文本中每个分词进行词性标注;根据所述词性标注确定相应分词中每个字符所对应的分类标签,得到所述样本文本对应的标签序列;基于所述样本文本以及对应的标签序列对信息抽取模型进行训练。采用本方法能够得到可以提取完整三元组信息的信息抽取模型。

    信息抽取方法、装置、计算机设备和存储介质

    公开(公告)号:CN111444349A

    公开(公告)日:2020-07-24

    申请号:CN202010150123.9

    申请日:2020-03-06

    IPC分类号: G06F16/36 G06F40/30

    摘要: 本申请涉及一种信息抽取方法、装置、计算机设备和存储介质。所述方法包括:获取目标文本;基于预训练的信息抽取模型提取目标文本的第一字符特征;根据第一字符特征从目标文本中抽取至少一个主语;分别基于抽取出的每个主语重构所述目标文本,得到一个或多个重构文本;提取重构文本的第二字符特征;根据第二字符特征,从每个重构文本中抽取对应主语的关系以及宾语。采用本方法能够提取出文本中的全部三元组信息。

    案件量罚指标的确定方法、装置、计算机设备和存储介质

    公开(公告)号:CN110489546A

    公开(公告)日:2019-11-22

    申请号:CN201910622812.2

    申请日:2019-07-11

    摘要: 本申请涉及一种案件量罚指标的确定方法、装置、计算机设备和存储介质。所述方法包括:对目标案件的案件信息进行特征提取,得到所述目标案件的特征信息;所述案件信息包括所述目标案件的案情描述,所述特征信息用于指示所述目标案件的案件特征;将所述案件信息和所述特征信息输入到预先训练的第一分类模型中,得到所述目标案件的案件罪名;将所述案件罪名和所述特征信息输入到预先训练的量罚模型中,得到所述目标案件的案件量罚指标。通过本发明实施例,无需建立庞大的处罚字典或者处罚规则库,降低了开发难度,同时也降低了后续维护的难度。

    信息抽取方法、装置、计算机设备和存储介质

    公开(公告)号:CN111444349B

    公开(公告)日:2023-09-12

    申请号:CN202010150123.9

    申请日:2020-03-06

    IPC分类号: G06F16/36 G06F40/30

    摘要: 本申请涉及一种信息抽取方法、装置、计算机设备和存储介质。所述方法包括:获取目标文本;基于预训练的信息抽取模型提取目标文本的第一字符特征;根据第一字符特征从目标文本中抽取至少一个主语;分别基于抽取出的每个主语重构所述目标文本,得到一个或多个重构文本;提取重构文本的第二字符特征;根据第二字符特征,从每个重构文本中抽取对应主语的关系以及宾语。采用本方法能够提取出文本中的全部三元组信息。

    基于深度学习的答案抽取方法、装置和存储介质

    公开(公告)号:CN109977404A

    公开(公告)日:2019-07-05

    申请号:CN201910225135.0

    申请日:2019-03-22

    摘要: 本申请涉及一种基于深度学习的答案抽取方法、装置和存储介质,该方法包括:获取用户问题,以及,根据所述用户问题,获取与所述用户问题相关的文档内容;基于深度学习模型,在所述文档内容中确定抽取起始位置和抽取结束位置;将所述抽取起始位置和所述抽取结束位置之间的文档内容,确定为所述用户问题所对应的答案,并展示所述答案。本申请不需要人工提取特征来制定各种匹配规则来提取答案,直接将获取到的用户问题以及与用户问题相关的文档内容输入到深度学习模型便可以从文档内容中得到与用户问题相匹配的最合适的答案,简化了答案提取过程,且提高了答案准确性,从而大大提高了自动客服的效率和质量。

    信息抽取方法、计算机设备和存储介质

    公开(公告)号:CN111444723B

    公开(公告)日:2023-07-28

    申请号:CN202010149572.1

    申请日:2020-03-06

    摘要: 本申请涉及一种信息抽取方法、计算机设备和存储介质。所述方法包括:确定样本文本中所包含的实体;根据所述样本文本中所包含的各实体的出现频次以及词性,对所述样本文本中每个分词进行词性标注;根据所述词性标注确定相应分词中每个字符所对应的分类标签,得到所述样本文本对应的标签序列;基于所述样本文本以及对应的标签序列对信息抽取模型进行训练。采用本方法能够得到可以提取完整三元组信息的信息抽取模型。

    警情串并方法、装置、设备及存储介质

    公开(公告)号:CN110532292A

    公开(公告)日:2019-12-03

    申请号:CN201910767708.2

    申请日:2019-08-20

    IPC分类号: G06F16/2455 G06Q50/26

    摘要: 本申请公开了一种警情串并方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:获取当前警情对应的特征信息集合,该特征信息集合包括至少一个特征信息,各该特征信息用于指示对应的警情的警情特征;获取待进行串并的目标历史警情对应的特征信息集合,并根据该当前警情对应的特征信息集合和该目标历史警情对应的特征信息集合获取该当前警情和该目标历史警情的相似度;当该相似度大于或等于预设相似度阈值时,对该当前警情和该目标历史警情进行串并。本申请实施例提供的技术方案能够在一定程度上解决警员资源浪费的问题。